Excel & IT Info

아이엑셀러 닷컴, 엑셀러TV

IT Info

저지르기 쉬운 데이터 시각화 실수 10가지와 방지하는 법

권현욱(엑셀러) 2024. 4. 14. 10:40
반응형

들어가기 전에

데이터 중심의 세계에서는 명확하고 통찰력 있는 데이터 시각화가 중요합니다. 데이터 시각화 자료를 만들 때 잘못된 해석으로 이어지는 실수를 저지르기 쉽습니다. 잘못된 데이터 시각화와 이를 방지하는 10가지 방법을 소개합니다.

권현욱(엑셀러) | 아이엑셀러 닷컴 대표 · Microsoft Excel MVP · Excel 솔루션 프로바이더 · 작가

※ 이 글은 아래 기사 내용을 토대로 작성되었습니다만, 필자의 개인 의견이나 추가 자료들이 다수 포함되어 있습니다.


  • 원문: 10 Common Data Visualization Mistakes and How to Avoid Them
  • URL: https://medium.com/agoda-engineering/10-common-data-visualization-mistakes-and-how-to-avoid-them-e3896fe8e104

[참고] 이 글은 차트와 관련된 다음 글과 함께 보시면 도움이 됩니다.
💎 차트 종류와 상황별 용법 정리

1. 지나치게 많은 색상 대비

다양한 색상을 사용하면 데이터 시각화를 해석하는 데 도움이 되지만 너무 많은 색상을 사용하면 혼란을 줄 수 있습니다. 제한된 수의 고유한 색상을 사용하는 것이 중요합니다.

 

(이미지: clauswilke)

 

이 유형의 시각화가 미치는 영향

  • 사용자는 어떤 값이 더 중요한지 오해합니다.
  • 시각화에 색상이 너무 많으면 사용자가 정보를 이해하는 데 시간이 더 오래 걸릴 수 있습니다.

 

문제 해결 방법

  • 핫톤 - 쿨톤 컬러를 사용하세요.
    핫/쿨 톤의 색상은 가치관과 긍정적/부정적 감정의 상당한 차이를 나타내는 데 도움이 됩니다.색상을 사용하여 어떤 값이 다른 값보다 높거나 낮은지 표시합니다. 대비가 높은 색상은 보는 사람에게 더 많은 데이터 가치를 인식하게 합니다.
  • 대비 값을 결정하는 가장 간단한 방법은 회색조의 대비 색상을 비교하여 선택한 색상에 차이가 있는지 확인하는 것입니다.

 

(이미지: medium)

 

  • 핫톤 - 쿨톤 컬러를 사용:  핫/쿨 톤의 색상은 가치관과 긍정적/부정적 감정의 상당한 차이를 나타내는 데 도움이 됩니다.

 

(이미지: medium)

 

2. 너무 많은 데이터가 포함된 차트

더 깊이 있는 정보를 제공하기 위해 데이터를 많이 넣은 것이 잘못된 것은 아니지만 지나치게 많은 데이터를 한꺼번에 보여주면 청중이 압도당할 수 있습니다.

 

(이미지: toptal)

 

이 유형의 시각화가 미치는 영향

  • 사용자는 시각화 세부정보를 모두 이해할 수 없습니다.
  • 사용자는 어디에 주의를 집중해야 할지 모릅니다.
  • 짧은 시간 안에 메시지를 해독하는 것은 어려울 것입니다.

 

문제 해결 방법

  • 사용자가 집중해야 할 사항만 결정하여 전달하려는 메시지와 가장 관련성이 높은 데이터로만 데이터를 제한합니다.
  • 모든 통찰력을 차트에 담지 마세요. 여러 개의 시각화를 사용하면 데이터를 보다 효과적으로 전달하는 데 도움이 될 수 있습니다.
  • 단일 시각화에서는 5~6개 이하의 색상을 사용하는 것이 좋습니다.

 

3. 기준선 생략 및 눈금 잘라내기

이런 유형의 데이터 시각화 문제는 정치 및 스포츠 분야에서 널리 퍼져 있으며, 존재하지 않는 잘못된 패턴이나 추세를 나타낼 수 있습니다.

 

(이미지: oldstreetsolutions)

 

이 유형의 시각화가 미치는 영향

  • 청중이 데이터를 완전히 이해하지 못하면 오해가 생기고, 경우에 따라서는 사회적 트렌드로 이어집니다.
  • 시각화가 잘못된 정보를 표시하고 있다는 사실을 청중이 깨닫게 되면 조직에 대한 신뢰를 잃게 됩니다.

 

문제 해결 방법

  • 0을 기준선으로 하는 Y축으로 데이터 시각화를 만드는 데 집중합니다.
  • 0을 제거하는 것이 합당한 경우, 0으로 나누기를 추가합니다. 0에서 시작하지 않아도 괜찮다는 것을 전달합니다.

 

4. 편향된 텍스트 수정

데이터 시각화에서 차트 자체는 대상과 소통할 뿐만 아니라 제목, 레이블, 표기법 및 설명도 사용자가 메시지를 이해하는 데 도움이 됩니다. 하지만 이러한 변경 사항이 데이터와 다소 다른 스토리를 제시하면 사용자는 혼란스러워할 수 있습니다.

 

(이미지: ecampusontario)

 

예를 들어, 위 그래프는 정형외과적 부상으로 고통받는 어린이의 비율을 보여줍니다. 사용자가 설명을 읽지 않고 헤드라인만 읽는다면 정상 어린이의 5.2%가 척수 손상을 앓고 있다고 믿어 심각한 오해를 불러일으킬 수도 있습니다.

이러한 유형의 시각화가 미치는 영향

  • 데이터가 정확하더라도 텍스트 수정이 오해의 소지가 있으면 청중의 해석에 영향을 미칠 수 있습니다.

문제 해결 방법

  • 서면 설명은 표시되는 내용을 명확히 하는 데 필요한 경우에만 사용해야 합니다.
  • 제목, 라벨, 설명이 편견 없이 의도한 의미를 전달하는지 확인하세요.

 

5. 잘못된 시각화 방법 선택

데이터를 표현하는 데 적합한 시각화를 선택하는 것은 데이터 시각화의 중요한 단계입니다. 데이터를 표시하는 데 여러 가지 차트가 적합할 수 있지만 가장 적합한 차트를 어떻게 선택할 수 있을까요?

 

(이미지: tessellationtech)

 

위 그림에서 두 차트 모두 각 후보자에 대한 응답 비율을 나타낼 수 있습니다. 하지만 파이 차트로 표현하면 차트 부분이 서로 비슷해 보이고 그 숫자의 합이 100%가 될 수 없기 때문에 사용자가 혼란을 느낄 수 있습니다.

이 유형의 시각화가 미치는 영향

  • 잘못된 차트 유형을 사용하면 보는 사람에게 혼란을 주거나 오해를 불러일으킬 수 있습니다.

데이터에 가장 적합한 차트를 선택하는 방법

  • 데이터에 적합한 차트를 선택하려면 먼저 데이터가 전달하려는 통찰력이 무엇인지 결정해야 합니다. 해당 정보가 있으면 데이터에 가장 적합한 차트를 선택하는 데 도움이 되는 몇 가지 간단한 지침이 있습니다.

 

(이미지:  Venn gage)

 

6. 인과관계 없는 상관관계

매우 다른 요인에도 불구하고 비슷한 추세를 보이는 데이터를 접한 적이 있나요? 이러한 요소들이 어떻게 연관되어 있는지 알아내려고 해도 연관성이 없는 것처럼 보입니다. 이는 사용자가 서로 아무런 관련이 없는 것의 원인을 찾으려고 노력하게 만드는 또 다른 형태의 데이터 시각화 실수입니다.

 

(이미지: tylervigen)

 

이 그래프에서 볼 수 있듯이 미국에서는 과학, 우주, 기술에 대한 투자 금액이 증가함에 따라 자살자 수가 증가하고 있으며 이는 동일한 추세로 보입니다. 그런데 과학에 더 많은 돈을 투자하면 자살 사례가 늘어난다는 것이 사실일까요?

이 유형의 시각화가 미치는 영향

  • 상관관계는 연결되어 있지 않기 때문에 오해의 소지가 있습니다.

 

문제 해결 방법

  • 항상 서로 가까이 있는 다양한 시각화 간의 상관 관계를 찾습니다.
  • 다음에 상관관계 데이터 모음을 접하게 되면 연관성이 있는지 스스로에게 물어보세요.

 

7. 유리한 데이터 확대

'체리 피킹(Cherry Picking)'이라는 기법이 있습니다. 자신의 관점을 뒷받침하는 데이터만 선택적으로 표시하고 반대되는 증거는 무시하는 방법입니다. 실제 데이터에서 얻은 약간의 인사이트만 비주얼리제이션에 표시됩니다.

 

(이미지: flowingdata)

 

이 유형의 시각화가 미치는 영향

  • 이 시각화는 중요한 데이터를 숨겨 사용자에게 약간의 인사이트만 제공합니다.

 

문제 해결 방법

  • 확대된 시각화와 전체 시각화를 비교하고 대조합니다(항상 가능한 옵션은 아닙니다).
  • 확대되지 않은 시각화를 하나의 그룹으로 결합하여 통계를 집계합니다. 예를 들어 평균 또는 합계로 집계합니다.

 

8. 인간의 일반적인 시각적 연상

인간은 사물을 지각하고 뇌를 사용하여 보이는 것을 해석하거나 이해합니다. 시각적 지각과 인지의 원리는 데이터 시각화에서도 필수적인데, 이는 청중이 메시지를 더 빠르고 더 잘 이해하는 데 도움이 되기 때문입니다. 시각 지각과 인지에 대한 간략한 개요를 살펴보겠습니다.

시각적 지각

시각 지각은 우리의 뇌가 시각 자료를 인식하는 방식입니다. 우리가 무언가를 보고 즉시 인식하는 것과 비슷합니다.

인지

시각 지각의 다음 단계입니다. 이것은 우리가 보는 것에 대해 배우고 지식과 이해력을 개발하는 정신적 과정입니다. 데이터 시각화에는 창의적인 색상, 아이콘, 글꼴, 제목, 레이블 및 기타 요소를 사용합니다. 이러한 특성을 통해 우리의 뇌가 메시지를 빠르고 다르게 해석하도록 도울 수 있습니다.

 

 

이 유형의 시각화가 미치는 영향

  • 뇌가 정보를 다르게 해석하는 방식을 이해하면 청중이 보다 효과적으로 전달하고자 하는 메시지를 집중하고 파악하는 데 도움이 될 수 있습니다.

 

문제 해결 방법

  • 색상은 요점을 분류하고 뒷받침하는 좋은 방법입니다. 색상은 사용자의 의사 결정에 중요한 역할을 합니다.
  • 데이터를 정렬하고 다양한 차트 섹션의 크기를 조정하여 데이터를 더 읽기 쉽게 만들 수 있습니다. 색상은 모두 사람들이 인식하는 방식에 영향을 미치는 의미를 가지고 있습니다.

 

9. 3D 그래프의 부적절한 사용

데이터 시각화 세계에서는 데이터를 표시하기 위해 다양한 차트를 사용할 수 있습니다. 차트 사용 가이드라인에 대한 여러 논의가 있으며, 3D는 가장 인기 있는 이슈 중 하나입니다. 사람의 눈은 3D 시각 자료를 해석하는 데 어려움을 겪기 때문에 데이터를 잘못 표현할 위험이 크기 때문에 대부분의 3D 차트는 더 이상 일반적인 데이터를 표시하는 데 자주 사용되지 않습니다.

 

 

이 원형 차트에서는 실제 값이 30% 대 35%임에도 불구하고 뒤쪽 절반이 앞쪽 절반보다 더 크게 표시됩니다. 또 다른 유형의 3D 차트에는 데이터 값을 정확하게 표시하는 데 몇 가지 문제가 있습니다.

이 유형의 시각화가 미치는 영향

  • 3D 차트는 데이터의 현실을 왜곡할 수 있습니다.

 

주요 요점

  • 가능하다면 대신 2D 차트를 사용하세요.
  • 세 축에 걸쳐 있는 값을 표현해야 하는 경우 색상 그라데이션이 있는 버블 플롯/산점도가 좋은 옵션이 될 수 있습니다.

 

10. 모든 인사이트를 시각화하려 하지 말 것

데이터는 때때로 스스로를 대변할 수 있습니다. 일부 값은 중요한 정보를 나타낼 수 있으며, 이러한 정보를 데이터 시각화에 표시할 필요가 없을 수도 있습니다.

 

 

이 유형의 시각화가 미치는 영향

  • 때로는 차트나 그래프로 데이터를 표시할 필요가 없을 수도 있습니다.

 

문제 해결 방법

  • 데이터 시각화는 정보를 전달하는 수단입니다. 이 도구를 사용해도 괜찮은 경우도 있고, 다른 도구가 더 적합한 경우도 있습니다.

Excel과 VBA의 모든 것 아이엑셀러 닷컴 · 강사들이 숨겨 놓고 보는 엑셀러TV

 

728x90
반응형