부스트 캠프 ai tech 3주 1일차 Data 시각화 (1)
1. Data의 종류
- Dataset은 아래와 같이 분류가 가능하다.
- 정형 데이터
- 시계열 데이터
- 지리 데이터
- 관계형 데이터
- 계층적 데이터
- 데이터는 아래와 같이 분류가 가능하다.
- 수치형 데이터(numerical) : 수치로 표현된 데이터
- 연속형(continuous) : 길이, 무게, 온도 등
- 이산형(discrete) : 사람 수, 주사위 눈금 등
- 범주형(categorical) : 문자로 표현되는 데이터
- 명목형(norminal) : 혈액형, 종교, 주소 등
- 순서형(ordinal) : 학년, 등급, 성적 등
- 수치형 데이터(numerical) : 수치로 표현된 데이터
1. 정형 데이터
- 가장 기본적인 데이터 형태
- 테이블 형태로 제공되는 데이터이다.
2. 시계열 데이터
- 시간에 흐름에 따른 데이터
- 기온 주가 등의 정형 데이터로 표현한 데이터와 음성, 비디오와 같이 비정형인 데이터가 존재한다.
3. 지리/지도 데이터
- 지형과 지명이 들어가 있는 데이터
- 위도와 경도를 이용해서 정형데이터로도 표현이 가능하다.
- 지도 정보와 보고자하는 정보간의 조화를 잘 맞추어 주는것이 중요하다
4. 관계형 데이터
- 객체와 객체간의 관계를 시각화 할 수 있는 데이터
- 객체는 Node로, 관계는 Link로 표현이 가능하다
- 크기와 색, 수 등으로 관계의 가중치를 표현 가능하다
- 보기쉽게 하기위해 휴리스틱하게 노드의 배치를 구성할 수 있다
5. 계층적 데이터
- 위의 관예형 데이터중에서 포함관계가 분명한 데이터
- Tree, Treemap등의 형태의 데이터가 포함된다
2. 시각화
- 수치와 문제로 이루어진 데이터를 점,선,면을 이용해서 한눈에 보기 쉽게 만들어준다
- 아래의 속성들을 적절하게 사용해서 시각적으로 분리를 일으켜서 주의 깊게 보지 않아도 한눈에 알아볼수 있도록 하는것이 목표이다
- 너무 많이 사용하면 오히려 인지하기 힘든 부작용이 나타난다
reference
부스트 캠프 ai tech 3주 1일차 Data 시각화 (1)
https://kyubumshin.github.io/2022/02/03/boostcamp/week/week3/Data-Viz-1/