시각화 설정

시각화 분석 설정 및 차트 옵션

IRIS-24

  • 분석 설정
  • 시각화 화면에서 데이터 모델을 선택한 뒤, 필드 목록에서 마우스 드래그&드랍으로 원하는 위치의 박스에 끌어다 놓음으로써 X축, Y축 박스에 필드를 설정할 수 있으며, 끌어다 놓은 이후에는 박스가 드래그한 필드로 설정됩니다.
  • 상세한 옵션을 변경하고 싶다면 X축, Y축에 해당하는 박스를 더블 클릭한 후, 새로 팝업 되는 창에서 설정을 변경하면 됩니다. 설정 가능한 옵션의 종류는 필드의 타입 및 X축/Y축 등에 따라 달라집니다.
  • 데이터 모델 및 시간 범위와 함께 해당 시각화 유형에서 필요로 하는 모든 설정을 끝냈다면 ‘실행 아이콘(▶)’을 눌러 시각화 작업을 진행할 수 있습니다.

시각화 분석 (1) 시계열

[시계열] 꺾은선형

꺾은선형은 시간의 경과에 따른 데이터의 변화를 꺾은선으로 시각화 하는 분석 방법입니다.

IRIS-25

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2


차트 옵션


Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다.

이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다.
3





X축





차트의 X축에 관한 설정 UI 입니다. 피벗의 “행 선택”과 대응됩니다.

꺾은선 차트의 경우 시간 필드만 X축에 설정할 수 있으며, 선택한 데이터 모델의 시간 필드가 자동으로 설정이 됩니다.

또한, 시간 범위 설정을 변경할 때마다 “Summary 시간 단위”가 어느정도 자동 조정이 됩니다.
4





Y축





차트의 Y축에 관한 설정 UI 입니다. 피벗의 “값 선택”과 대응됩니다.

설정한 필드를 지정한 “Summary 방식”에 따라 계산하여 수치화한 값으로 Y축을 구성합니다.

설정하지 않으면 Default로 “이벤트 개수”가 설정됩니다. (-count(*))
5





그룹





트의 색상/범례 분할에 관한 설정 UI 입니다.

각 데이터를 그룹핑할 컬럼을 지정하는 기능입니다.

피벗의 “열 선택”과 대응되나, 집계에 영향을 주지 않고 분류(Classify) 기능만 수행합니다.
6


파일 저장


파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다.


  • X축

    • Summary 시간 단위: 시각화 작업을 수행할 때 어떠한 시간 단위(1년, 1개월, 1일, …)로 summary를 수행할지 선택하는 옵션입니다.
    • 최대 행 수: 시각화 작업 결과의 데이터 개수를 제한하는 옵션입니다.
  • Y축

    • Summary 방식: 시각화 작업을 수행할 때 지정한 필드를 어떠한 함수로 summary를 수행할지 선택하는 옵션입니다. 문자형 필드의 경우 “데이터 개수”, 숫자형 필드의 경우 “합계”가 기본으로 설정됩니다.
    • 최대 열 수: 시각화 작업 결과 개수를 제한하는 옵션입니다. 최대 행 수와는 다르게 테이블 기준 열 수, 차트 기준으로는 범례 개수를 제한합니다.
  • 그룹

    • 최대 열 수: 시각화 작업 결과 개수를 제한하는 옵션입니다. 최대 행 수와는 다르게 테이블 기준 열 수, 차트 기준으로는 범례 개수를 제한합니다.

차트 옵션 - [시계열] 꺾은선형

  • 일반

    • Null 값: 데이터가 Null이거나 없는 등 차트에 표현할 수 없을 때 표현방식을 결정합니다.
    • 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자값 텍스트로 표시됩니다.
  • X축

    • 축: X축 표시 여부를 결정합니다.
    • 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
    • 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
  • Y축

    • 축: Y축 표시 여부를 결정합니다.
    • 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
    • 간격: Y축의 수치 간격을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 최솟값: Y축의 최솟값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 최댓값: Y축의 최댓값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
  • 범례

    • 범례: 범례의 표시 여부를 결정합니다.
    • 표시 위치: 범례의 표시 위치(오른쪽/아래/위/왼쪽)를 결정합니다.

[시계열] 시계열 분포(산점도)

시간 필드가 포함된 데이터, X축과 Y축에 연속형인 두 변수의 값을 점으로 뿌려준 그래프로 변수 간의 관계를 파악하는데 유용한 분석 방법이며, 특히 X축을 시간 컬럼으로 지정한 시계열데이터를 시간에 따른 산점도 형태로 보여주기 용이합니다.

IRIS-26

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2


차트 옵션


Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다.

이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다.
3





X축





차트의 X축에 관한 설정 UI 입니다.

꺾은선 차트의 경우 시간 필드만 X축에 설정할 수 있으나, 시계열 차트는 Scatter(산점도) 기능을 하는 차트로서 X축에 시간 컬럼 외에 다른 타입의 컬럼이 올 수 있습니다.

또한, X축 설정 중 최대 행 수는 시각화 작업 결과의 데이터 개수를 제한하는 옵션을 말합니다.
4Y축차트의 Y축에 관한 설정 UI 입니다. 시계열 분포(산점도)의 경우, 반드시 설정해야 합니다.
5


그룹


트의 색상/범례 분할에 관한 설정 UI 입니다. 각 데이터를 그룹핑할 컬럼을 지정하는 기능입니다.

피벗의 “열 선택”과 대응되나, 집계에 영향을 주지 않고 분류(Classify) 기능만 수행합니다.
6파일 저장파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다.

차트 옵션 - [시계열] 시계열 분포

  • X축

    • 축: X축 표시 여부를 결정합니다.
    • 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
    • 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
  • Y축

    • 축: Y축 표시 여부를 결정합니다.
    • 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
    • 간격: Y축의 수치 간격을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 최솟값: Y축의 최솟값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 최댓값: Y축의 최댓값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
  • 범례

    • 범례: 범례의 표시 여부를 결정합니다.
    • 표시 위치: 범례의 표시 위치(오른쪽/아래/위/왼쪽)를 결정합니다.

[시계열] 모션

모션 차트는 거품형 차트를 기반으로 시간에 따른 데이터의 변화를 애니메이션으로 보여주는 차트입니다.

모션차트는 시간, X축, Y축, 크기(원의 크기), 그룹(원의 색상) 에 각각 컬럼을 지정할 수 있습니다.

IRIS-27

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2X축차트의 X축에 관한 설정 UI입니다. 숫자 유형 컬럼만 투입할 수 있습니다.
3시간시간 유형 컬럼만 투입할 수 있습니다.
4Y축차트의 Y축에 관한 설정 UI 입니다. 숫자 유형 컬럼만 투입할 수 있습니다.
5그룹범주형 컬럼만 투입할 수 있습니다.
6크기숫자 유형 컬럼만 투입할 수 있습니다.
7파일 저장파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다.
8애니메이션 제어(모션 실행)애니메이션 동작에 대하여 실행/일시정지/재생/정지 등을 할 수 있습니다.

시각화 분석 (2) 분포

[분포] 히스토그램

데이터를 동일한 폭의 구간으로 나누어 해당 구간에 속한 데이터의 빈도를 막대로 나타낸 것입니다. 도수분포표라고도 합니다. X축은 구간을 나타내고, Y축은 해당 구간에 속한 빈도를 표시합니다.

IRIS-28

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2


차트 옵션


Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다.

이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다.
3X축X축에 올 컬럼을 설정할 수 있습니다. 또한 X축은 히스토그램의 구간을 나타냅니다.
4Y축Y축에 올 컬럼을 설정할 수 있습니다. Y축은 해당 구간에 속한 빈도를 표시합니다.
5그룹차트의 색상/범례 분할에 관한 설정 UI 입니다. 피벗의 “열 선택”과 대응됩니다.
6파일 저장파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다.
  • X축

    • 정렬: Y축 값에 따른 정렬 방식을 선택하는 옵션입니다. Default는 “기본값”이며, “기본값”으로 선택하면 정렬을 수행하지 않습니다.

    • Summary 시간 단위: 시간 타입 필드의 경우, 시각화 작업을 수행할 때 어떠한 시간 단위(1년, 1개월, 1일 등)로 summary를 수행할지 선택하는 옵션입니다.

    • 범위 만들기: 숫자형 타입 필드의 경우, 실행 결과로 출력되는 각 막대를 필드 값의 개별 숫자로 표현할 것인지, 일정 범위를 지정하여 구간으로 표현할 것인지 여부를 묻는 항목입니다.

      • 범위 크기: 그룹핑할 범위의 크기입니다.
      • 범위 시작: 범위가 시작되는 값입니다.
      • 범위 끝: 범위의 마지막 값입니다.
    • 최대 행 수: 시각화 작업 결과의 데이터 개수를 제한하는 옵션입니다.

  • Y축

    • 최대 열 수: 시각화 작업 결과 개수를 제한하는 옵션입니다. 최대 행 수와는 다르게 테이블 기준 열 수, 차트 기준으로는 범례 개수를 제한합니다.

차트 옵션 - [분포] 히스토그램

  • 일반

    • 스택모드: 하나의 X축 데이터가 그룹/범례를 통해 분할되었을 때, 차트의 드로잉 객체를 별개로 표현할 지 하나의 객체에 나누어 표현할지를 결정합니다.
    • 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자값 텍스트로 표시됩니다.
  • X축

    • 축: X축 표시 여부를 결정합니다.
    • 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
    • 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
  • Y축

    • 축: Y축 표시 여부를 결정합니다.
    • 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
    • 간격: Y축의 수치 간격을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 최솟값: Y축의 최솟값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 최댓값: Y축의 최댓값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
  • 범례

    • 범례: 범례의 표시 여부를 결정합니다.
    • 표시 위치: 범례의 표시 위치(오른쪽/아래/위/왼쪽)를 결정합니다.

[분포] 막대형

막대형 그래프(Bar Chart)는 X축에 카테고리, 범주형 변수가 올 수 있고, 수치형 변수도 가능합니다.

IRIS-29

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2


차트 옵션


Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다.

이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다.
3X축X축에 올 컬럼을 설정할 수 있습니다. 또한 X축은 히스토그램의 구간을 나타냅니다.
4Y축Y축에 올 컬럼을 설정할 수 있습니다. Y축은 해당 구간에 속한 빈도를 표시합니다.
5그룹차트의 색상/범례 분할에 관한 설정 UI 입니다. 피벗의 “열 선택”과 대응됩니다.
6파일 저장파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다.
  • X축

    • 정렬: Y축 값에 따른 정렬 방식을 선택하는 옵션입니다. Default는 “기본값”이며, “기본값”으로 선택하면 정렬을 수행하지 않습니다.

    • Summary 시간 단위: 시간 타입 필드의 경우, 시각화 작업을 수행할 때 어떠한 시간 단위(1년, 1개월, 1일 등)로 summary를 수행할지 선택하는 옵션입니다.

    • 범위 만들기: 숫자형 타입 필드의 경우, 실행 결과로 출력되는 각 막대를 필드 값의 개별 숫자로 표현할 것인지, 일정 범위를 지정하여 구간으로 표현할 것인지 여부를 묻는 항목입니다.

      • 범위 크기: 그룹핑 할 범위의 크기입니다.
      • 범위 시작: 범위가 시작되는 값입니다.
      • 범위 끝: 범위의 마지막 값입니다.
    • 최대 행 수: 시각화 작업 결과의 데이터 개수를 제한하는 옵션입니다.

  • Y축

    • Summary 방식: 시각화 작업을 수행할 때 지정한 필드를 어떠한 함수로 summary를 수행할지 선택하는 옵션입니다. 문자형 필드의 경우 “데이터 개수”, 숫자형 필드의 경우 “합계”가 기본으로 설정됩니다.
  • 그룹

    • 최대 열 수: 시각화 작업 결과 개수를 제한하는 옵션입니다. 최대 행 수와는 다르게 테이블 기준 열 수, 차트 기준으로는 범례 개수를 제한합니다.

차트 옵션 - [분포] 막대형

  • 일반

    • 스택모드: 하나의 X축 데이터가 그룹/범례를 통해 분할되었을 때, 차트의 드로잉 객체를 별개로 표현할 지 하나의 객체에 나누어 표현할지를 결정합니다.
    • 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자값 텍스트로 표시됩니다.
  • X축

    • 축: X축 표시 여부를 결정합니다.
    • 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
    • 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
  • Y축

    • 축: Y축 표시 여부를 결정합니다.
    • 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
    • 간격: Y축의 수치 간격을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 최솟값: Y축의 최솟값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 최댓값: Y축의 최댓값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
  • 범례

    • 범례: 범례의 표시 여부를 결정합니다.
    • 표시 위치: 범례의 표시 위치(오른쪽/아래/위/왼쪽)를 결정합니다.

[분포] 원형

원형 그래프는 섹터로 구분된 원 그래프이며 Pie chart 라고도 합니다. 각 파이 조각의 크기는 전체에서 해당 데이터의 상대적 크기를 표시합니다.

IRIS-30

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2


차트 옵션


Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다.

이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다.
3





크기





파이차트의 크기에 관한 설정 UI 입니다. 피벗의 “값 선택”과 대응됩니다.

설정한 필드를 지정한 “Summary 방식”에 따라 계산하여 수치화한 값으로 크기를 결정합니다.

설정하지 않으면 Default로 “이벤트 개수”가 설정됩니다. (-count(*))
4


그룹


파이 차트의 그룹에 관한 설정 UI 입니다.

다른 차트의 X축 설정과 동일하며, 피벗의 “행 선택”과 대응됩니다.
5파일 저장파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다.
  • 크기

    • Summary 방식: 시각화 작업을 수행할 때 지정한 필드를 어떠한 함수로 summary를 수행할지 선택하는 옵션입니다. 문자형 필드의 경우 “데이터 개수”, 숫자형 필드의 경우 “합계”가 기본으로 설정됩니다.
  • 그룹

    • 정렬: 값에 따른 정렬 방식을 선택하는 옵션입니다. Default는 “기본값”이며, “기본값”으로 선택하면 정렬을 수행하지 않습니다.

    • Summary 시간 단위: 시간 타입 필드의 경우, 시각화 작업을 수행할 때 어떠한 시간 단위(1년, 1개월, 1일, …)로 summary를 수행할지 선택하는 옵션입니다.

    • 범위 만들기: 숫자형 타입 필드의 경우, 실행 결과로 출력되는 각 막대를 필드 값의 개별 숫자로 표현할 것인지, 일정 범위를 지정하여 구간으로 표현할 것인지 여부를 묻는 항목입니다.

      • 범위 크기: 그룹핑 할 범위의 크기입니다.
      • 범위 시작: 범위가 시작되는 값입니다.
      • 범위 끝: 범위의 마지막 값입니다.
    • 최대 행 수: 시각화 작업 결과의 데이터 개수를 제한하는 옵션입니다.

차트 옵션 - [분포] 원형

  • 일반

    • 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자값 텍스트로 표시됩니다.
  • 크기

    • 최소 크기: 지정한 비율 이하의 조각들을 “other”로 통합하는 옵션입니다. 예를 들어 3으로 지정하면, 0~3% 비율의 조각들을 하나로 합쳐서 표현합니다. Default는 0이며, 0으로 입력하면 “other”로 통합하지 않습니다.

시각화 분석 (3) 관계형

[관계형] Sankey

Sankey chart는 각 변수간의 데이터의 흐름을 볼 수 있는 그래프입니다. 노드의 크기는 해당 데이터의 크기, 볼륨을 나타내고, 노드와 노드를 잇는 선의 굵기는 노드에서 노드 로 연결되는 데이터의 양을 표현합니다. 가중치는 선의 굵기, 노드의 크기를 정하는 통계량을 의미합니다. Default 는 이벤트의 개수 입니다.

IRIS-31

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2





컬럼 설정/추가 버튼





차트의 컬럼에 관한 설정 UI입니다.

필드를 설정하여 각 단계별 데이터 간의 흐름을 확인할 수 있습니다.

‘+’버튼으로 컬럼을 최대 5개까지 추가 가능하며, 필드를 설정해야만 반영됩니다.
3


가중치


데이터 간의 흐름의 크기, Sankey 차트에서는 선의 굵기에 대한 설정 UI입니다.

피벗의 “값 선택”과 유사하게 “Summary 방식”을 지정할 수 있으며, 추가로 상위/하위 N개만 출력하도록 필터를 지정할 수 도 있습니다.
4파일 저장파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다.
  • 가중치

    • Summary 방식

      • 시각화 작업을 수행할 때 지정한 필드를 어떠한 함수로 summary를 수행할지 선택하는 옵션입니다. 문자형 필드의 경우 “데이터 개수”, 숫자형 필드의 경우 “합계”가 기본으로 설정됩니다.
    • 제한

      • 지정한 숫자값 만큼 상위 or 하위 N개의 선(Links) 데이터만 요청하도록 설정합니다.

[관계형] 히트맵

히트맵은 cell 의 값이 높거나 양이 큰 경우에는 진한 색상, 작은 값은 연한 색상과 같은 열분포로 표현합니다.

IRIS-32

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2


차트 옵션


Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다.

이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다.
3X축차트의 X축에 관한 설정 UI 입니다. 피벗의 “행 선택”과 대응됩니다.
4Y축차트의 Y축에 관한 설정 UI 입니다. 피벗의 “열 선택”과 대응됩니다.
5











차트의 색상/범례 분할에 관한 설정 UI 입니다. 피벗의 “값 선택”과 대응됩니다.

설정한 필드를 지정한 “Summary 방식”에 따라 계산하여 수치화한 값으로 Y축을 구성합니다.

설정하지 않으면 Default로 “이벤트 개수”가 설정됩니다. (-count(*))
6파일 저장파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다.
  • X축

    • 정렬: Y축 값에 따른 정렬 방식을 선택하는 옵션입니다. Default는 ‘기본값'이며, 기본값으로 선택하면 정렬을 수행하지 않습니다.

    • Summary 시간 단위: 시간 타입 필드의 경우, 시각화 작업을 수행할 대 어떠한 시간 단위(1년, 1개월, 1일 등)로 Summary를 수행할 지 선택하는 옵션입니다.

    • 범위 만들기: 숫자형 타입 필드의 경우, 실행 결과로 출력되는 각 막대를 필드 값의 개별 숫자로 표현할 것인지, 일정 범위를 지정하여 구간으로 표현할 것인지 여부를 묻는 항목입니다.

      • 범위 크기: 그룹핑 할 범위의 크기입니다.
      • 범위 시작: 범위가 시작되는 값 입니다
      • 범위 끝: 범위의 마지막 값입니다.
    • 최대 행 수: 시각화 작업의 결과의 데이터 개수를 제한하는 옵션입니다.

  • Y축

    • 최대 열 수: 시각화 작업 결과 개수를 제한하는 옵션입니다. 최대 행 수 와는 다르게 테이블 기준 열 수, 차트 기준으로는 범례 개수를 제한합니다.
    • Summary 방식: 시각화 작업을 수행할 때 지정한 필드를 어떠한 함수로 Summary를 수행할 지 선택하는 옵션입니다. 문자형 필드의 경우 ‘데이터 개수‘, 숫자형 필드의 경우 ‘합계'가 기본으로 설정됩니다.

차트 옵션 - [관계형] 히트맵

  • 일반

    • 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자값 텍스트로 표시됩니다.
    • 배경 색상: 배경의 색상을 설정할 수 있습니다.
    • 구분선 색상: 구분선의 색상을 설정할 수 있습니다.
  • X축

    • 축: X축 표시 여부를 결정합니다.
    • 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
    • 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
    • 정렬: 오름차순/내림차순 정렬을 할 수 있습니다.
  • Y축

    • 축: Y축 표시 여부를 결정합니다.
    • 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
    • 레이블 회전: Y축의 텍스트 회전 각도를 결정합니다. Y축의 각각의 텍스트가 길 경우 유용합니다.
    • 정렬: 오름차순/내림차순 정렬을 할 수 있습니다.
  • 범례

    • 범례: 범례의 표시 여부를 결정합니다.

시각화 분석 (4) 이상치

[이상치] Anomaly

Anomaly 그래프는 데이터에서 이상치를 찾아내어 꺾은 선형 차트로 보여줍니다. 이상치를 찾는 내부 알고리즘은 DSL 명령어 anomalies 를 적용합니다.

IRIS-33

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2


차트 옵션


Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다.

이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다.
3X축시간유형(timestamp/date) 컬럼을 투입할 수 있습니다.
4Y축수치형 데이터만 투입할 수 있습니다.
5그룹범주형 데이터만 투입할 수 있습니다.
6Anomaly 옵션Anomaly에 관한 옵션을 설정할 수 있습니다.
7파일 저장파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다.

차트 옵션 - [이상치] Anomaly

  • 일반

    • 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자 값 텍스트로 표시됩니다.
    • 데이터 표시 색상: 데이터의 색상을 설정할 수 있습니다.
    • 이상치 데이터 값 표시 색상: 이상치 데이터 값의 색상을 설정할 수 있습니다.
  • X축

    • 축: X축 표시 여부를 결정합니다.
    • 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
    • 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
  • Y축

    • 축: Y축 표시 여부를 결정합니다.
    • 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
    • 간격: Y축의 수치 간격을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 최솟값: Y축의 최솟값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 최댓값: Y축의 최댓값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
  • 범례

    • 범례: 범례의 표시 여부를 결정합니다.
    • 표시 위치: 범례의 표시 위치(오른쪽/아래/위/왼쪽)를 결정합니다.
  • Anomaly 옵션

    • alg: 이상치를 찾는 알고리즘이며, bagic / robust 가 있습니다.
    • bound: 이상치와 정상값을 구분하는 임계치 범위의 폭을 결정하는 값으로, 이 값이 정상값으로 판정하는 범위가 넓어집니다.
    • direct: 이상치와 정상값을 구분하는 임계치가 위로만 있는 경우(above), 아래에만 있는 경우(below), 위,아래 다 있을 때(both)로 구분됩니다.
    • alert_window: 이상치를 판별하는 데이터의 시간 범위를 정합니다. 데이터의 가장 최근 시간 기준입니다.
    • Index_type: X축 필드의 시간 유형이며, timestamp / date 가 있습니다.

[이상치] Outlier

Outlier 그래프는 데이터에서 이상치 구간을 검출하는 분석 그래프입니다.

IRIS-34

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2


차트 옵션


Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다.

이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다.
3Y축숫자형 컬럼만 투입할 수 있습니다.
4


그룹


차트의 색상/범례 분할에 관한 설정 UI 입니다. 각 데이터를 그룹핑할 컬럼을 지정하는 기능입니다.

피벗의 “열 선택”과 대응되나, 집계에 영향을 주지 않고 분류(Classify) 기능만 수행합니다.
5Outlier 옵션Outlier에 관한 옵션을 설정할 수 있습니다.
6파일 저장파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다.

차트 옵션 - [이상치] Outlier

  • 일반

    • 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자 값 텍스트로 표시됩니다.
    • 데이터 표시 색상: 데이터의 색상을 설정할 수 있습니다.
    • 이상치 데이터 값 표시 색상: 이상치 데이터 값의 색상을 설정할 수 있습니다.
  • X축

    • 축: X축 표시 여부를 결정합니다.
    • 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
    • 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
  • Y축

    • 축: Y축 표시 여부를 결정합니다.
    • 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
    • 간격: Y축의 수치 간격을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 최솟값: Y축의 최솟값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 최댓값: Y축의 최댓값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
  • 범례

    • 범례: 범례의 표시 여부를 결정합니다.
    • 표시 위치: 범례의 표시 위치(오른쪽/아래/위/왼쪽)를 결정합니다.
    • 글꼴: 범례의 글꼴과 글꼴 크기, 글꼴 서식 및 정렬에 관한 설정을 할 수 있습니다.
  • Outlier 옵션

    • alg: 이상치를 찾는 알고리즘이며, bagic / robust 가 있습니다.
    • tolerance: 임계값 범위의 scale을 지정합니다.

[이상치] 이상치

시각화 이상치 그래프는 특정 변수에 대한 기술통계량과 함께 IQR(Inter Quantile Range)기반으로 비정상적으로 벗어난 값을 찾아줍니다.

히스토그램 과 시계열 분포 에서는 실제 데이터의 분포를 보여주고, 기술통계량 에서는 데이터의 사분위수 값을 보여줍니다.

이상치에서 이상치로 판정된 데이터를 대상으로 사분위수를 보여줘서 전체 데이터의 기술통계량과 비교할 수 있게 합니다.

  • 이상치 판단 기준

    • 하한 임계치(Q1 - 1.5 * IQR) 보다 작은 값이거나
    • 상한 임계치(Q3 + 1.5 * IQR) 보다 큰 값을 이상치로 판단합니다.
    • IQR = Q3 - Q1
    • Q1 : 1st 사분위수(25% 값) , Q3 : 3rd 사분위수(75% 값)

IRIS-35

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2


대상 컬럼


통계량 및 이상치를 계산할 대상 필드(컬럼)를 설정합니다. .

다른 차트와 마찬가지로 Drag & Drop으로 설정하며, 숫자형 타입의 필드만 설정할 수 있습니다.
3히스토그램대상 필드의 값 분포를 히스토그램으로 나타냅니다.
4기술통계량해당 필드의 최소/최대, 중간값, 평균 등의 각종 기술통계량 값을 표 형태로 출력합니다.
5시계열분포대상 필드의 시계열 분포를 산점도로 나타냅니다.
6이상치(Outlier)해당 필드의 정상 범주를 벗어나는 값들에 대해 최소/최대, 중간값, 평균 등의 각종 기술통계량 값을 표 형태로 출력합니다.
7분석 결과 다운로드해당 차트 혹은 그리드를 파일로 저장합니다. 차트의 경우에는 png, 그리드의 경우에는 csv로 저장합니다.
8새로 고침해당 차트 혹은 그리드의 데이터를 서버에 다시 요청하여 불러옵니다.

시각화 분석 (5) 예측

[예측] Forecast

Forecast는 시계열 데이터에서 미래 시점의 값을 예측하기 위해 DSL forecasts 의 결과를 보여주는 시각화 차트입니다.

DSL 명령어 forecasts 의 결과는 예측에 사용된 과거 데이터와 함께 미래시점의 데이터가 같이 출력됩니다.

IRIS-36

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2


차트 옵션


Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다.

이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다.
3Y축시간유형(timestamp/date) 컬럼을 투입할 수 있습니다.
4그룹수치형 데이터만 투입할 수 있습니다.
5Outlier 옵션Forecast에 관한 옵션을 설정할 수 있습니다.
6파일 저장파일 저장 버튼을 누르면 시각화에서 만든 차트가 이미지 파일(png)로 저장됩니다.

차트 옵션 - [예측] Forecast

  • 일반

    • 데이터 값 표시: 데이터의 수치 값을 차트상에 표시할지 여부를 결정합니다. “켜기”로 설정하면 차트의 각 포인트마다 데이터 수치가 숫자 값 텍스트로 표시됩니다.
    • 데이터 표시 색상: 데이터의 색상을 설정할 수 있습니다.
    • 예측치 데이터 값 표시 색상: 이상치 데이터 값의 색상을 설정할 수 있습니다.
    • 예측치 최대·최소 데이터 표시: 예측치의 최대, 최소 데이터 값의 색상을 설정할 수 있습니다.
  • X축

    • 축: X축 표시 여부를 결정합니다.
    • 축 제목: X축 하단에 표시할 제목과 표시 여부를 결정합니다.
    • 레이블 회전: X축의 텍스트 회전 각도를 결정합니다. X축의 각각의 텍스트가 길 경우 유용합니다.
    • 글꼴: X축의 글꼴과 글꼴 크기, 글꼴 서식 및 정렬에 관한 설정을 할 수 있습니다.
  • Y축

    • 축: Y축 표시 여부를 결정합니다.
    • 축 제목: Y축 좌단에 표시할 제목과 표시 여부를 결정합니다.
    • 간격: Y축의 수치 간격을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 최솟값: Y축의 최솟값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 최댓값: Y축의 최댓값을 결정합니다. 입력하지 않으면 자동으로 결정됩니다.
    • 글꼴: Y축의 글꼴과 글꼴 크기, 글꼴 서식 및 정렬에 관한 설정을 할 수 있습니다.
  • 범례

    • 범례: 범례의 표시 여부를 결정합니다.
    • 표시 위치: 범례의 표시 위치(오른쪽/아래/위/왼쪽)를 결정합니다.
    • 글꼴: 범례의 글꼴과 글꼴 크기, 글꼴 서식 및 정렬에 관한 설정을 할 수 있습니다.
  • Forecast 옵션

    • alg: 시계열 데이터 예측에 사용되는 알고리즘이며, Default 로 linear 알고리즘이 설정되어 있습니다.
    • F_coeff: 예측값이 계산되어 결과로 나오는 기간을 구하는 데 사용되는 계수입니다.
    • Index_type: X축 필드의 시간 유형을 나타내며, timestamp / date 중에 선택하여 사용할 수 있습니다.

시각화 분석 (6) 지도형

[지도형] 마커 맵

마커 맵은 데이터의 위/경도 좌표 지점을 지도 상에 포인트 또는 깃발 등으로 시각화 한 지도를 뜻합니다. 값(Value) 컬럼을 지정하여 수치 값을 마커의 색상으로 표현할 수도 있습니다.

IRIS-37

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2


차트 옵션


Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다.

이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다.
3


Value


값으로 지정할 컬럼을 투입합니다.

값 컬럼을 지정하면 차트 옵션의 색상 설정에 따라 값 수치를 마커의 색상으로 시각화 할 수 있습니다.
4경도경도로 지정할 컬럼을 투입합니다.
5위도위도로 지정할 컬럼을 투입합니다.

[지도형] 클러스터 맵

통계값을 이용해 데이터를 클러스터링하여 지도 위에 표시하는 지도 차트 입니다.

IRIS-38

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2


차트 옵션


Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다.

이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다.
3경도경도로 지정할 컬럼을 투입합니다.
4위도위도로 지정할 컬럼을 투입합니다.
5


Group by


군집으로 묶은 클러스터링 데이터를 그룹핑하기 위한 컬럼을 지정하는 기능입니다.

적절한 컬럼을 지정하면 지도 상에 데이터가 원형 차트로 시각화됩니다.
6


이벤트 개수


군집으로 묶은 클러스터링 데이터를 시각화 할 때 원의 크기를 결정할 컬럼을 지정하는 기능입니다.

기본값은 이벤트 개수(count(*))이며, 다른 컬럼을 지정하고 집계 함수를 설정할 수 있습니다. (ex. 인구수의 평균)

[지도형] 지역맵

Analyzer에서 제공하는 지역 경계 좌표 정보를 토대로, 지도 영역(콜렉션)을 사용하여 데이터를 지도 위에 히트맵처럼 표시하는 지도 차트 입니다.

IRIS-39

번호구분설명
1분석 유형 선택시계열 / 분포 / 관계형 / 이상치 / 예측 / 지도형 카테고리 중 분석 유형을 선택할 수 있습니다.
2


차트 옵션


Null값 표시 방식, 레이블 회전, 범례 위치 등 차트의 스타일/표현 방식에 대한 옵션 설정창을 띄우는 버튼입니다.

이 옵션들은 시각화 작업 결과 데이터에는 영향을 주지 않습니다.
3


Value


데이터를 시각화 할 때 색상을 결정하기 위한 컬럼을 지정하는 기능입니다.

기본값은 이벤트 개수(count(*))이며, 다른 컬럼을 지정하고 집계 함수를 설정할 수 있습니다.
4Feature Collection미리 정의되어 있는 지역 경계 좌표 정보(city; 시, dong; 동, state; 도)입니다. 현재는 대한민국만 제공합니다.
5


Feature ID


Feature Collection과 매치 시킬 컬럼을 지정하는 기능입니다.

미리 선택한 Feature Collection에 따라 관련된 Feature ID를 잘 지정함으로써 어떤 값이 어떠한 데이터인지 알 수 있도록 해야 합니다.
6Feature 모두 표시경계가 나뉘어 있지 않은 구간의 지역일지라 하더라도, 나머지 경계를 토대로 모든 Feature 값이 모두 표시되게 할 수 있습니다.