시각화 설정
시각화 분석 설정 및 차트 옵션
- 분석 설정
- 시각화 화면에서 데이터 모델을 선택한 뒤, 필드 목록에서 마우스 드래그&드랍으로 원하는 위치의 박스에 끌어다 놓음으로써 X축, Y축 박스에 필드를 설정할 수 있으며, 끌어다 놓은 이후에는 박스가 드래그한 필드로 설정됩니다.
- 상세한 옵션을 변경하고 싶다면 X축, Y축에 해당하는 박스를 더블 클릭한 후, 새로 팝업 되는 창에서 설정을 변경하면 됩니다. 설정 가능한 옵션의 종류는 필드의 타입 및 X축/Y축 등에 따라 달라집니다.
- 데이터 모델 및 시간 범위와 함께 해당 시각화 유형에서 필요로 하는 모든 설정을 끝냈다면 ‘실행 아이콘(▶)’을 눌러 시각화 작업을 진행할 수 있습니다.
시각화 분석 (1) 시계열
[시계열] 꺾은선형
꺾은선형은 시간의 경과에 따른 데이터의 변화를 꺾은선으로 시각화 하는 분석 방법입니다.
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | 차트 옵션 | Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다. 이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다. |
3 | X축 | 차트의 X축에 관한 설정 UI 입니다. 피벗의 “행 선택”과 대응됩니다. 꺾은선 차트의 경우 시간 필드만 X축에 설정할 수 있으며, 선택한 데이터 모델의 시간 필드가 자동으로 설정이 됩니다. 또한, 시간 범위 설정을 변경할 때마다 “Summary 시간 단위”가 어느정도 자동 조정이 됩니다. |
4 | Y축 | 차트의 Y축에 관한 설정 UI 입니다. 피벗의 “값 선택”과 대응됩니다. 설정한 필드를 지정한 “Summary 방식”에 따라 계산하여 수치화한 값으로 Y축을 구성합니다. 설정하지 않으면 Default로 “이벤트 개수”가 설정됩니다. (-count(*)) |
5 | 그룹 | 트의 색상/범례 분할에 관한 설정 UI 입니다. 각 데이터를 그룹핑할 컬럼을 지정하는 기능입니다. 피벗의 “열 선택”과 대응되나, 집계에 영향을 주지 않고 분류(Classify) 기능만 수행합니다. |
6 | 파일 저장 | 파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다. |
-
X축
- Summary 시간 단위: 시각화 작업을 수행할 때 어떠한 시간 단위(1년, 1개월, 1일, …)로 summary를 수행할지 선택하는 옵션입니다.
- 최대 행 수: 시각화 작업 결과의 데이터 개수를 제한하는 옵션입니다.
-
Y축
- Summary 방식: 시각화 작업을 수행할 때 지정한 필드를 어떠한 함수로 summary를 수행할지 선택하는 옵션입니다. 문자형 필드의 경우 “데이터 개수”, 숫자형 필드의 경우 “합계”가 기본으로 설정됩니다.
- 최대 열 수: 시각화 작업 결과 개수를 제한하는 옵션입니다. 최대 행 수와는 다르게 테이블 기준 열 수, 차트 기준으로는 범례 개수를 제한합니다.
-
그룹
- 최대 열 수: 시각화 작업 결과 개수를 제한하는 옵션입니다. 최대 행 수와는 다르게 테이블 기준 열 수, 차트 기준으로는 범례 개수를 제한합니다.
차트 옵션 - [시계열] 꺾은선형
-
일반
- Null 값: 데이터가 Null이거나 없는 등 차트에 표현할 수 없을 때 표현방식을 결정합니다.
- 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자값 텍스트로 표시됩니다.
-
X축
- 축: X축 표시 여부를 결정합니다.
- 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
- 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
-
Y축
- 축: Y축 표시 여부를 결정합니다.
- 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
- 간격: Y축의 수치 간격을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 최솟값: Y축의 최솟값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 최댓값: Y축의 최댓값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
-
범례
- 범례: 범례의 표시 여부를 결정합니다.
- 표시 위치: 범례의 표시 위치(오른쪽/아래/위/왼쪽)를 결정합니다.
[시계열] 시계열 분포(산점도)
시간 필드가 포함된 데이터, X축과 Y축에 연속형인 두 변수의 값을 점으로 뿌려준 그래프로 변수 간의 관계를 파악하는데 유용한 분석 방법이며, 특히 X축을 시간 컬럼으로 지정한 시계열데이터를 시간에 따른 산점도 형태로 보여주기 용이합니다.
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | 차트 옵션 | Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다. 이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다. |
3 | X축 | 차트의 X축에 관한 설정 UI 입니다. 꺾은선 차트의 경우 시간 필드만 X축에 설정할 수 있으나, 시계열 차트는 Scatter(산점도) 기능을 하는 차트로서 X축에 시간 컬럼 외에 다른 타입의 컬럼이 올 수 있습니다. 또한, X축 설정 중 최대 행 수는 시각화 작업 결과의 데이터 개수를 제한하는 옵션을 말합니다. |
4 | Y축 | 차트의 Y축에 관한 설정 UI 입니다. 시계열 분포(산점도)의 경우, 반드시 설정해야 합니다. |
5 | 그룹 | 트의 색상/범례 분할에 관한 설정 UI 입니다. 각 데이터를 그룹핑할 컬럼을 지정하는 기능입니다. 피벗의 “열 선택”과 대응되나, 집계에 영향을 주지 않고 분류(Classify) 기능만 수행합니다. |
6 | 파일 저장 | 파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다. |
차트 옵션 - [시계열] 시계열 분포
-
X축
- 축: X축 표시 여부를 결정합니다.
- 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
- 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
-
Y축
- 축: Y축 표시 여부를 결정합니다.
- 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
- 간격: Y축의 수치 간격을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 최솟값: Y축의 최솟값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 최댓값: Y축의 최댓값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
-
범례
- 범례: 범례의 표시 여부를 결정합니다.
- 표시 위치: 범례의 표시 위치(오른쪽/아래/위/왼쪽)를 결정합니다.
[시계열] 모션
모션 차트는 거품형 차트를 기반으로 시간에 따른 데이터의 변화를 애니메이션으로 보여주는 차트입니다.
모션차트는 시간, X축, Y축, 크기(원의 크기), 그룹(원의 색상) 에 각각 컬럼을 지정할 수 있습니다.
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | X축 | 차트의 X축에 관한 설정 UI입니다. 숫자 유형 컬럼만 투입할 수 있습니다. |
3 | 시간 | 시간 유형 컬럼만 투입할 수 있습니다. |
4 | Y축 | 차트의 Y축에 관한 설정 UI 입니다. 숫자 유형 컬럼만 투입할 수 있습니다. |
5 | 그룹 | 범주형 컬럼만 투입할 수 있습니다. |
6 | 크기 | 숫자 유형 컬럼만 투입할 수 있습니다. |
7 | 파일 저장 | 파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다. |
8 | 애니메이션 제어(모션 실행) | 애니메이션 동작에 대하여 실행/일시정지/재생/정지 등을 할 수 있습니다. |
시각화 분석 (2) 분포
[분포] 히스토그램
데이터를 동일한 폭의 구간으로 나누어 해당 구간에 속한 데이터의 빈도를 막대로 나타낸 것입니다. 도수분포표라고도 합니다. X축은 구간을 나타내고, Y축은 해당 구간에 속한 빈도를 표시합니다.
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | 차트 옵션 | Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다. 이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다. |
3 | X축 | X축에 올 컬럼을 설정할 수 있습니다. 또한 X축은 히스토그램의 구간을 나타냅니다. |
4 | Y축 | Y축에 올 컬럼을 설정할 수 있습니다. Y축은 해당 구간에 속한 빈도를 표시합니다. |
5 | 그룹 | 차트의 색상/범례 분할에 관한 설정 UI 입니다. 피벗의 “열 선택”과 대응됩니다. |
6 | 파일 저장 | 파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다. |
-
X축
-
정렬: Y축 값에 따른 정렬 방식을 선택하는 옵션입니다. Default는 “기본값”이며, “기본값”으로 선택하면 정렬을 수행하지 않습니다.
-
Summary 시간 단위: 시간 타입 필드의 경우, 시각화 작업을 수행할 때 어떠한 시간 단위(1년, 1개월, 1일 등)로 summary를 수행할지 선택하는 옵션입니다.
-
범위 만들기: 숫자형 타입 필드의 경우, 실행 결과로 출력되는 각 막대를 필드 값의 개별 숫자로 표현할 것인지, 일정 범위를 지정하여 구간으로 표현할 것인지 여부를 묻는 항목입니다.
- 범위 크기: 그룹핑할 범위의 크기입니다.
- 범위 시작: 범위가 시작되는 값입니다.
- 범위 끝: 범위의 마지막 값입니다.
-
최대 행 수: 시각화 작업 결과의 데이터 개수를 제한하는 옵션입니다.
-
-
Y축
- 최대 열 수: 시각화 작업 결과 개수를 제한하는 옵션입니다. 최대 행 수와는 다르게 테이블 기준 열 수, 차트 기준으로는 범례 개수를 제한합니다.
차트 옵션 - [분포] 히스토그램
-
일반
- 스택모드: 하나의 X축 데이터가 그룹/범례를 통해 분할되었을 때, 차트의 드로잉 객체를 별개로 표현할 지 하나의 객체에 나누어 표현할지를 결정합니다.
- 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자값 텍스트로 표시됩니다.
-
X축
- 축: X축 표시 여부를 결정합니다.
- 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
- 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
-
Y축
- 축: Y축 표시 여부를 결정합니다.
- 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
- 간격: Y축의 수치 간격을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 최솟값: Y축의 최솟값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 최댓값: Y축의 최댓값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
-
범례
- 범례: 범례의 표시 여부를 결정합니다.
- 표시 위치: 범례의 표시 위치(오른쪽/아래/위/왼쪽)를 결정합니다.
[분포] 막대형
막대형 그래프(Bar Chart)는 X축에 카테고리, 범주형 변수가 올 수 있고, 수치형 변수도 가능합니다.
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | 차트 옵션 | Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다. 이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다. |
3 | X축 | X축에 올 컬럼을 설정할 수 있습니다. 또한 X축은 히스토그램의 구간을 나타냅니다. |
4 | Y축 | Y축에 올 컬럼을 설정할 수 있습니다. Y축은 해당 구간에 속한 빈도를 표시합니다. |
5 | 그룹 | 차트의 색상/범례 분할에 관한 설정 UI 입니다. 피벗의 “열 선택”과 대응됩니다. |
6 | 파일 저장 | 파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다. |
-
X축
-
정렬: Y축 값에 따른 정렬 방식을 선택하는 옵션입니다. Default는 “기본값”이며, “기본값”으로 선택하면 정렬을 수행하지 않습니다.
-
Summary 시간 단위: 시간 타입 필드의 경우, 시각화 작업을 수행할 때 어떠한 시간 단위(1년, 1개월, 1일 등)로 summary를 수행할지 선택하는 옵션입니다.
-
범위 만들기: 숫자형 타입 필드의 경우, 실행 결과로 출력되는 각 막대를 필드 값의 개별 숫자로 표현할 것인지, 일정 범위를 지정하여 구간으로 표현할 것인지 여부를 묻는 항목입니다.
- 범위 크기: 그룹핑 할 범위의 크기입니다.
- 범위 시작: 범위가 시작되는 값입니다.
- 범위 끝: 범위의 마지막 값입니다.
-
최대 행 수: 시각화 작업 결과의 데이터 개수를 제한하는 옵션입니다.
-
-
Y축
- Summary 방식: 시각화 작업을 수행할 때 지정한 필드를 어떠한 함수로 summary를 수행할지 선택하는 옵션입니다. 문자형 필드의 경우 “데이터 개수”, 숫자형 필드의 경우 “합계”가 기본으로 설정됩니다.
-
그룹
- 최대 열 수: 시각화 작업 결과 개수를 제한하는 옵션입니다. 최대 행 수와는 다르게 테이블 기준 열 수, 차트 기준으로는 범례 개수를 제한합니다.
차트 옵션 - [분포] 막대형
-
일반
- 스택모드: 하나의 X축 데이터가 그룹/범례를 통해 분할되었을 때, 차트의 드로잉 객체를 별개로 표현할 지 하나의 객체에 나누어 표현할지를 결정합니다.
- 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자값 텍스트로 표시됩니다.
-
X축
- 축: X축 표시 여부를 결정합니다.
- 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
- 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
-
Y축
- 축: Y축 표시 여부를 결정합니다.
- 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
- 간격: Y축의 수치 간격을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 최솟값: Y축의 최솟값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 최댓값: Y축의 최댓값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
-
범례
- 범례: 범례의 표시 여부를 결정합니다.
- 표시 위치: 범례의 표시 위치(오른쪽/아래/위/왼쪽)를 결정합니다.
[분포] 원형
원형 그래프는 섹터로 구분된 원 그래프이며 Pie chart 라고도 합니다. 각 파이 조각의 크기는 전체에서 해당 데이터의 상대적 크기를 표시합니다.
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | 차트 옵션 | Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다. 이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다. |
3 | 크기 | 파이차트의 크기에 관한 설정 UI 입니다. 피벗의 “값 선택”과 대응됩니다. 설정한 필드를 지정한 “Summary 방식”에 따라 계산하여 수치화한 값으로 크기를 결정합니다. 설정하지 않으면 Default로 “이벤트 개수”가 설정됩니다. (-count(*)) |
4 | 그룹 | 파이 차트의 그룹에 관한 설정 UI 입니다. 다른 차트의 X축 설정과 동일하며, 피벗의 “행 선택”과 대응됩니다. |
5 | 파일 저장 | 파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다. |
-
크기
- Summary 방식: 시각화 작업을 수행할 때 지정한 필드를 어떠한 함수로 summary를 수행할지 선택하는 옵션입니다. 문자형 필드의 경우 “데이터 개수”, 숫자형 필드의 경우 “합계”가 기본으로 설정됩니다.
-
그룹
-
정렬: 값에 따른 정렬 방식을 선택하는 옵션입니다. Default는 “기본값”이며, “기본값”으로 선택하면 정렬을 수행하지 않습니다.
-
Summary 시간 단위: 시간 타입 필드의 경우, 시각화 작업을 수행할 때 어떠한 시간 단위(1년, 1개월, 1일, …)로 summary를 수행할지 선택하는 옵션입니다.
-
범위 만들기: 숫자형 타입 필드의 경우, 실행 결과로 출력되는 각 막대를 필드 값의 개별 숫자로 표현할 것인지, 일정 범위를 지정하여 구간으로 표현할 것인지 여부를 묻는 항목입니다.
- 범위 크기: 그룹핑 할 범위의 크기입니다.
- 범위 시작: 범위가 시작되는 값입니다.
- 범위 끝: 범위의 마지막 값입니다.
-
최대 행 수: 시각화 작업 결과의 데이터 개수를 제한하는 옵션입니다.
-
차트 옵션 - [분포] 원형
-
일반
- 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자값 텍스트로 표시됩니다.
-
크기
- 최소 크기: 지정한 비율 이하의 조각들을 “other”로 통합하는 옵션입니다. 예를 들어 3으로 지정하면, 0~3% 비율의 조각들을 하나로 합쳐서 표현합니다. Default는 0이며, 0으로 입력하면 “other”로 통합하지 않습니다.
시각화 분석 (3) 관계형
[관계형] Sankey
Sankey chart는 각 변수간의 데이터의 흐름을 볼 수 있는 그래프입니다. 노드의 크기는 해당 데이터의 크기, 볼륨을 나타내고, 노드와 노드를 잇는 선의 굵기는 노드에서 노드 로 연결되는 데이터의 양을 표현합니다. 가중치는 선의 굵기, 노드의 크기를 정하는 통계량을 의미합니다. Default 는 이벤트의 개수 입니다.
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | 컬럼 설정/추가 버튼 | 차트의 컬럼에 관한 설정 UI입니다. 필드를 설정하여 각 단계별 데이터 간의 흐름을 확인할 수 있습니다. ‘+’버튼으로 컬럼을 최대 5개까지 추가 가능하며, 필드를 설정해야만 반영됩니다. |
3 | 가중치 | 데이터 간의 흐름의 크기, Sankey 차트에서는 선의 굵기에 대한 설정 UI입니다. 피벗의 “값 선택”과 유사하게 “Summary 방식”을 지정할 수 있으며, 추가로 상위/하위 N개만 출력하도록 필터를 지정할 수 도 있습니다. |
4 | 파일 저장 | 파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다. |
-
가중치
-
Summary 방식
- 시각화 작업을 수행할 때 지정한 필드를 어떠한 함수로 summary를 수행할지 선택하는 옵션입니다. 문자형 필드의 경우 “데이터 개수”, 숫자형 필드의 경우 “합계”가 기본으로 설정됩니다.
-
제한
- 지정한 숫자값 만큼 상위 or 하위 N개의 선(Links) 데이터만 요청하도록 설정합니다.
-
[관계형] 히트맵
히트맵은 cell 의 값이 높거나 양이 큰 경우에는 진한 색상, 작은 값은 연한 색상과 같은 열분포로 표현합니다.
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | 차트 옵션 | Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다. 이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다. |
3 | X축 | 차트의 X축에 관한 설정 UI 입니다. 피벗의 “행 선택”과 대응됩니다. |
4 | Y축 | 차트의 Y축에 관한 설정 UI 입니다. 피벗의 “열 선택”과 대응됩니다. |
5 | 값 | 차트의 색상/범례 분할에 관한 설정 UI 입니다. 피벗의 “값 선택”과 대응됩니다. 설정한 필드를 지정한 “Summary 방식”에 따라 계산하여 수치화한 값으로 Y축을 구성합니다. 설정하지 않으면 Default로 “이벤트 개수”가 설정됩니다. (-count(*)) |
6 | 파일 저장 | 파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다. |
-
X축
-
정렬: Y축 값에 따른 정렬 방식을 선택하는 옵션입니다. Default는 ‘기본값'이며, 기본값으로 선택하면 정렬을 수행하지 않습니다.
-
Summary 시간 단위: 시간 타입 필드의 경우, 시각화 작업을 수행할 대 어떠한 시간 단위(1년, 1개월, 1일 등)로 Summary를 수행할 지 선택하는 옵션입니다.
-
범위 만들기: 숫자형 타입 필드의 경우, 실행 결과로 출력되는 각 막대를 필드 값의 개별 숫자로 표현할 것인지, 일정 범위를 지정하여 구간으로 표현할 것인지 여부를 묻는 항목입니다.
- 범위 크기: 그룹핑 할 범위의 크기입니다.
- 범위 시작: 범위가 시작되는 값 입니다
- 범위 끝: 범위의 마지막 값입니다.
-
최대 행 수: 시각화 작업의 결과의 데이터 개수를 제한하는 옵션입니다.
-
-
Y축
- 최대 열 수: 시각화 작업 결과 개수를 제한하는 옵션입니다. 최대 행 수 와는 다르게 테이블 기준 열 수, 차트 기준으로는 범례 개수를 제한합니다.
-
값
- Summary 방식: 시각화 작업을 수행할 때 지정한 필드를 어떠한 함수로 Summary를 수행할 지 선택하는 옵션입니다. 문자형 필드의 경우 ‘데이터 개수‘, 숫자형 필드의 경우 ‘합계'가 기본으로 설정됩니다.
차트 옵션 - [관계형] 히트맵
-
일반
- 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자값 텍스트로 표시됩니다.
- 배경 색상: 배경의 색상을 설정할 수 있습니다.
- 구분선 색상: 구분선의 색상을 설정할 수 있습니다.
-
X축
- 축: X축 표시 여부를 결정합니다.
- 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
- 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
- 정렬: 오름차순/내림차순 정렬을 할 수 있습니다.
-
Y축
- 축: Y축 표시 여부를 결정합니다.
- 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
- 레이블 회전: Y축의 텍스트 회전 각도를 결정합니다. Y축의 각각의 텍스트가 길 경우 유용합니다.
- 정렬: 오름차순/내림차순 정렬을 할 수 있습니다.
-
범례
- 범례: 범례의 표시 여부를 결정합니다.
시각화 분석 (4) 이상치
[이상치] Anomaly
Anomaly 그래프는 데이터에서 이상치를 찾아내어 꺾은 선형 차트로 보여줍니다. 이상치를 찾는 내부 알고리즘은 DSL 명령어 anomalies 를 적용합니다.
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | 차트 옵션 | Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다. 이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다. |
3 | X축 | 시간유형(timestamp/date) 컬럼을 투입할 수 있습니다. |
4 | Y축 | 수치형 데이터만 투입할 수 있습니다. |
5 | 그룹 | 범주형 데이터만 투입할 수 있습니다. |
6 | Anomaly 옵션 | Anomaly에 관한 옵션을 설정할 수 있습니다. |
7 | 파일 저장 | 파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다. |
차트 옵션 - [이상치] Anomaly
-
일반
- 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자 값 텍스트로 표시됩니다.
- 데이터 표시 색상: 데이터의 색상을 설정할 수 있습니다.
- 이상치 데이터 값 표시 색상: 이상치 데이터 값의 색상을 설정할 수 있습니다.
-
X축
- 축: X축 표시 여부를 결정합니다.
- 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
- 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
-
Y축
- 축: Y축 표시 여부를 결정합니다.
- 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
- 간격: Y축의 수치 간격을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 최솟값: Y축의 최솟값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 최댓값: Y축의 최댓값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
-
범례
- 범례: 범례의 표시 여부를 결정합니다.
- 표시 위치: 범례의 표시 위치(오른쪽/아래/위/왼쪽)를 결정합니다.
-
Anomaly 옵션
- alg: 이상치를 찾는 알고리즘이며, bagic / robust 가 있습니다.
- bound: 이상치와 정상값을 구분하는 임계치 범위의 폭을 결정하는 값으로, 이 값이 정상값으로 판정하는 범위가 넓어집니다.
- direct: 이상치와 정상값을 구분하는 임계치가 위로만 있는 경우(above), 아래에만 있는 경우(below), 위,아래 다 있을 때(both)로 구분됩니다.
- alert_window: 이상치를 판별하는 데이터의 시간 범위를 정합니다. 데이터의 가장 최근 시간 기준입니다.
- Index_type: X축 필드의 시간 유형이며, timestamp / date 가 있습니다.
[이상치] Outlier
Outlier 그래프는 데이터에서 이상치 구간을 검출하는 분석 그래프입니다.
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | 차트 옵션 | Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다. 이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다. |
3 | Y축 | 숫자형 컬럼만 투입할 수 있습니다. |
4 | 그룹 | 차트의 색상/범례 분할에 관한 설정 UI 입니다. 각 데이터를 그룹핑할 컬럼을 지정하는 기능입니다. 피벗의 “열 선택”과 대응되나, 집계에 영향을 주지 않고 분류(Classify) 기능만 수행합니다. |
5 | Outlier 옵션 | Outlier에 관한 옵션을 설정할 수 있습니다. |
6 | 파일 저장 | 파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다. |
차트 옵션 - [이상치] Outlier
-
일반
- 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자 값 텍스트로 표시됩니다.
- 데이터 표시 색상: 데이터의 색상을 설정할 수 있습니다.
- 이상치 데이터 값 표시 색상: 이상치 데이터 값의 색상을 설정할 수 있습니다.
-
X축
- 축: X축 표시 여부를 결정합니다.
- 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
- 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
-
Y축
- 축: Y축 표시 여부를 결정합니다.
- 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
- 간격: Y축의 수치 간격을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 최솟값: Y축의 최솟값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 최댓값: Y축의 최댓값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
-
범례
- 범례: 범례의 표시 여부를 결정합니다.
- 표시 위치: 범례의 표시 위치(오른쪽/아래/위/왼쪽)를 결정합니다.
- 글꼴: 범례의 글꼴과 글꼴 크기, 글꼴 서식 및 정렬에 관한 설정을 할 수 있습니다.
-
Outlier 옵션
- alg: 이상치를 찾는 알고리즘이며, bagic / robust 가 있습니다.
- tolerance: 임계값 범위의 scale을 지정합니다.
[이상치] 이상치
시각화 이상치 그래프는 특정 변수에 대한 기술통계량과 함께 IQR(Inter Quantile Range)기반으로 비정상적으로 벗어난 값을 찾아줍니다.
히스토그램 과 시계열 분포 에서는 실제 데이터의 분포를 보여주고, 기술통계량 에서는 데이터의 사분위수 값을 보여줍니다.
이상치에서 이상치로 판정된 데이터를 대상으로 사분위수를 보여줘서 전체 데이터의 기술통계량과 비교할 수 있게 합니다.
-
이상치 판단 기준
- 하한 임계치(Q1 - 1.5 * IQR) 보다 작은 값이거나
- 상한 임계치(Q3 + 1.5 * IQR) 보다 큰 값을 이상치로 판단합니다.
- IQR = Q3 - Q1
- Q1 : 1st 사분위수(25% 값) , Q3 : 3rd 사분위수(75% 값)
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | 대상 컬럼 | 통계량 및 이상치를 계산할 대상 필드(컬럼)를 설정합니다. . 다른 차트와 마찬가지로 Drag & Drop으로 설정하며, 숫자형 타입의 필드만 설정할 수 있습니다. |
3 | 히스토그램 | 대상 필드의 값 분포를 히스토그램으로 나타냅니다. |
4 | 기술통계량 | 해당 필드의 최소/최대, 중간값, 평균 등의 각종 기술통계량 값을 표 형태로 출력합니다. |
5 | 시계열분포 | 대상 필드의 시계열 분포를 산점도로 나타냅니다. |
6 | 이상치(Outlier) | 해당 필드의 정상 범주를 벗어나는 값들에 대해 최소/최대, 중간값, 평균 등의 각종 기술통계량 값을 표 형태로 출력합니다. |
7 | 분석 결과 다운로드 | 해당 차트 혹은 그리드를 파일로 저장합니다. 차트의 경우에는 png, 그리드의 경우에는 csv로 저장합니다. |
8 | 새로 고침 | 해당 차트 혹은 그리드의 데이터를 서버에 다시 요청하여 불러옵니다. |
시각화 분석 (5) 예측
[예측] Forecast
Forecast는 시계열 데이터에서 미래 시점의 값을 예측하기 위해 DSL forecasts 의 결과를 보여주는 시각화 차트입니다.
DSL 명령어 forecasts 의 결과는 예측에 사용된 과거 데이터와 함께 미래시점의 데이터가 같이 출력됩니다.
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | 차트 옵션 | Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다. 이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다. |
3 | Y축 | 시간유형(timestamp/date) 컬럼을 투입할 수 있습니다. |
4 | 그룹 | 수치형 데이터만 투입할 수 있습니다. |
5 | Outlier 옵션 | Forecast에 관한 옵션을 설정할 수 있습니다. |
6 | 파일 저장 | 파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다. |
차트 옵션 - [예측] Forecast
-
일반
- 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자 값 텍스트로 표시됩니다.
- 데이터 표시 색상: 데이터의 색상을 설정할 수 있습니다.
- 예측치 데이터 값 표시 색상: 이상치 데이터 값의 색상을 설정할 수 있습니다.
- 예측치 최대·최소 데이터 표시: 예측치의 최대, 최소 데이터 값의 색상을 설정할 수 있습니다.
-
X축
- 축: X축 표시 여부를 결정합니다.
- 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
- 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
- 글꼴: X축의 글꼴과 글꼴 크기, 글꼴 서식 및 정렬에 관한 설정을 할 수 있습니다.
-
Y축
- 축: Y축 표시 여부를 결정합니다.
- 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
- 간격: Y축의 수치 간격을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 최솟값: Y축의 최솟값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 최댓값: Y축의 최댓값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
- 글꼴: Y축의 글꼴과 글꼴 크기, 글꼴 서식 및 정렬에 관한 설정을 할 수 있습니다.
-
범례
- 범례: 범례의 표시 여부를 결정합니다.
- 표시 위치: 범례의 표시 위치(오른쪽/아래/위/왼쪽)를 결정합니다.
- 글꼴: 범례의 글꼴과 글꼴 크기, 글꼴 서식 및 정렬에 관한 설정을 할 수 있습니다.
-
Forecast 옵션
- alg: 시계열 데이터 예측에 사용되는 알고리즘이며, Default 로 linear 알고리즘이 설정되어 있습니다.
- F_coeff: 예측값이 계산되어 결과로 나오는 기간을 구하는 데 사용되는 계수입니다.
- Index_type: X축 필드의 시간 유형을 나타내며, timestamp / date 중에 선택하여 사용할 수 있습니다.
시각화 분석 (6) 지도형
[지도형] 마커 맵
마커 맵은 데이터의 위/경도 좌표 지점을 지도 상에 포인트 또는 깃발 등으로 시각화 한 지도를 뜻합니다. 값(Value) 컬럼을 지정하여 수치 값을 마커의 색상으로 표현할 수도 있습니다.
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | 차트 옵션 | Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다. 이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다. |
3 | Value | 값으로 지정할 컬럼을 투입합니다. 값 컬럼을 지정하면 차트 옵션의 색상 설정에 따라 값 수치를 마커의 색상으로 시각화 할 수 있습니다. |
4 | 경도 | 경도로 지정할 컬럼을 투입합니다. |
5 | 위도 | 위도로 지정할 컬럼을 투입합니다. |
[지도형] 클러스터 맵
통계값을 이용해 데이터를 클러스터링하여 지도 위에 표시하는 지도 차트 입니다.
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | 차트 옵션 | Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다. 이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다. |
3 | 경도 | 경도로 지정할 컬럼을 투입합니다. |
4 | 위도 | 위도로 지정할 컬럼을 투입합니다. |
5 | Group by | 군집으로 묶은 클러스터링 데이터를 그룹핑하기 위한 컬럼을 지정하는 기능입니다. 적절한 컬럼을 지정하면 지도 상에 데이터가 원형 차트로 시각화됩니다. |
6 | 이벤트 개수 | 군집으로 묶은 클러스터링 데이터를 시각화 할 때 원의 크기를 결정할 컬럼을 지정하는 기능입니다. 기본값은 이벤트 개수(count(*))이며, 다른 컬럼을 지정하고 집계 함수를 설정할 수 있습니다. (ex. 인구수의 평균) |
[지도형] 지역맵
Analyzer에서 제공하는 지역 경계 좌표 정보를 토대로, 지도 영역(콜렉션)을 사용하여 데이터를 지도 위에 히트맵처럼 표시하는 지도 차트 입니다.
번호 | 구분 | 설명 |
---|---|---|
1 | 분석 유형 선택 | 시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다. |
2 | 차트 옵션 | Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다. 이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다. |
3 | Value | 데이터를 시각화 할 때 색상을 결정하기 위한 컬럼을 지정하는 기능입니다. 기본값은 이벤트 개수(count(*))이며, 다른 컬럼을 지정하고 집계 함수를 설정할 수 있습니다. |
4 | Feature Collection | 미리 정의되어 있는 지역 경계 좌표 정보(city; 시, dong; 동, state; 도)입니다. 현재는 대한민국만 제공합니다. |
5 | Feature ID | Feature Collection과 매치 시킬 컬럼을 지정하는 기능입니다. 미리 선택한 Feature Collection에 따라 관련된 Feature ID를 잘 지정함으로써 어떤 값이 어떠한 데이터인지 알 수 있도록 해야 합니다. |
6 | Feature 모두 표시 | 경계가 나뉘어 있지 않은 구간의 지역일지라 하더라도, 나머지 경계를 토대로 모든 Feature 값이 모두 표시되게 할 수 있습니다. |