디자인

데이터 시각화 스터디 #1 - 데이터 시각화를 위한 기본 요소

lanace 2021. 4. 22. 11:27

종종 프로젝트가 커지거나 운영을 위해 현재 상태를 한눈에 보려고 할때 대시보드를 구현하곤 했다.

지금까지 기억나는건 한 2개의 대시보드를 개발해보았다.

내가 기억하는 대시보드는 여러개의 차트들이 화려하게 움직히고, 실시간으로 현재 시스템에 어떤 일들이 벌어지는게 눈에 보이는 전광판의 느낌이였다.

그럼 이러한 대시보드가 도움이 되었는가? 라고 묻는다면.... 나야 모르지!

내가 쓸게 아니였으니까... 이걸 쓰는건 운영하시는 분들이거나 통계관련 기획자 분들이셨으니 내가 신경쓸것이 아니였다.

그러다 이번에 대시보드를 만들게 되었는데, 간단한 기획적 요소들과 차트에 대한 이해가 필요하게 되어 서점에서 10권 정도의 데이터 시각화 관련 책을 훑어보았다.

그중 대시보드 설계와 데이터 시각화 라는 책을 보게 되었고 지금 읽고있다.

읽으면서 내가 많은 착각과 얇은 시야로 보고있다는걸 느꼈고, 책에서 배운 내용을 정리한 뒤 직접 대입해볼 예정이다.

 

 

대시보드란?

대시보드는 사람들이 정의하기에 따라 달라질것이다.

책에서는 이렇게 정의한다.

대시보드란 상황을 모니터링하거나, 이해를 돕거나, 둘 다에 사용하는 데이터의 시각적 표현이다.

세상에 완벽한 대시보드는 존재할 수 없다.

각자 처한 상황이 다르고, 받아들이는게 다르고, 말하는게 다르다. 따라서 모든것이 가능한 대시보드는 불가능하고, 적절히 물어보는 질문에 대답해줄 수 있는 데이터를 시각화하여 표현하면 된다.

시각화를 통해 단기 기억을 공략하여 대량의 데이터를 즉시 해석할 수 있게 한다.

말이 조금 어려운데, 아래 테이블을 보자.

 

 

위의 테이블을 통해 어떤 정보를 얻을 수 있을까?

한눈에 보았을때 하나씩 확인해야 비로소 그 값의 차이를 알 수 있다.

하지만 아래 차트는 어떠한가?

 

각 그룹별 차이점이 명확하게 알 수 있다.

비록 정확한 값을 확인하려면 표가 더 편하지만 추이를 보기엔 차트가 훨씬 더 좋다.

즉, 표를 통해 분석하기엔 앞선 값들을 모두 기억하고 있어야 그 추이를 알 수 있다. 이러한 어려움을 해결해 주는것이 차트이고 데이터 시각화이다.

그럼 어떻게 대시보드를 구성하면 될까?

 

 

시나리오

일단 대시보드가 필요한 이유부터 살펴보면 좋을것같다.

내가 간과하고 있던 부분이 이런 부분이다.

대시보드를 만들땐 대시보드를 통해 하고싶은 말이 있어야한다.

  • 매출이 작년대비 얼마나 변하였는가?
  • 프로모션을 통해 유입된 신규 유저는 얼마나 많은가?
  • 각 지역별 후보자 선호도는 어떻게 되는가?

위와같이 대시보드에 무언가를 질문했을때 그에대한 답변을 들을 수 있어야한다.

그리고 그 답변을 효율적으로 전달받을 수 있어야 한다.

따라서 현재 처해있는 상황에 따라, 대시보드의 목적에 따라 구성과 표현이 완전히 달라진다.

어떤 상황인지 이해하기 위해선 시나리오를 써보는게 효과적인듯 하다.

쉬워보이지만 색상, 폰트, 선, 인터렉션 등등 수많은 고민이 녹아있다는 것을 하나씩 살펴보도록 하자.

 

 

시각화의 2가지 속성 - 전주의적 속성

전주의적 속성이라 하면 무언가 어려워보이지만 매우 간단하다.

아래 테이블을 보자

 

 

두 테이블에 7 인 값을 찾아보자.

아마 오른쪽 테이블을 보았을때 바로 찾아내는것을 알 수 있을것이다.

이처럼 다른것들과 작은 차이를 통해 강조하는것을 전주의적 속성이라 한다.

이러한 요소들에는 다음과 같은 것들이 있다.

  • 방향
  • 길이
  • 너비
  • 크기
  • 형태
  • 곡률
  • 표시 추가
  • 둘러싸기
  • 색상
  • 색조
  • 위치
  • 공간적 그룹핑

하지만 이런 요소를 난잡하게 사용하면 의미가 없어진다.

다름 테이블을 보자

 

 

요소가 너무 많이 적용되면 효과가 없어지고 오히려 알아보기 힘들게 바뀐다.

따라서 너무 난잡하게 많이 도입하지 않고, 정말 중요한 것에 강조를 줄 때 사용하자.

 

 

시각화의 2가지 속성 - 데이터 유형

시각화 하려는 데이터의 유형에 따라서 접근 방법도 다르게 해야한다.

  • 범주형 데이터숫자나 값에 상호관계가 없는것
  • ex) 이름, 나이, 직업, 등등...
  • 사물을 나타냄
  • 순서형 데이터그외에는 범주형 데이터와 동일
  • ex) 계급, 출생일, 만족도, 연봉 등등...
  • 순서가 분명한 것
  • 정량적 데이터이산과 연속 데이터로 나뉨
  • ex) 키, 번호, 매출, 이익 등등...
  • 숫자로, 측정 분류 가능한 데이터

위의 차트를 보고 데이터를 유형별로 나누어 보자

  • 나라 / 범주형 데이터 / 위치
  • 사망자 / 정량적 데이터 / 길이
  • 사망 유형 / 범주형 데이터 / 색
  • 공격 / 정량적 데이터 / 크기

 

위와 같이 여러 정보들을 유형에 따라 분류하고, 각각을 어떻게하면 효율적으로 표현할 수 있을지 고민해보아야 한다. 

 

결론

효과적인 대시보드를 만들려면, 장식에만 치중한 차트 유형을 사용하려는 유혹을 이겨내야 한다.

 

서로 다른 모양의 차트로 보여줄 수 있는것은 서로 다른 이야기이다.

결정할 것은 선택한 차트가 현재의 질문에 적절한 대답을 하는지 측정하는 것이다.