사람들은 예로부터 사회, 문화, 경제 전반의 현상과 그 연관 관계들을 연구하고, 그 결과를 어떻게 보다 쉽고 효율적으로 사람들에게 전달할 수 있을지에 대해서 고민을 해왔다. 사람이 가지고 있는 오감(五感)중에 가장 빠르게 정보를 처리하고 전체 감각기관의 약 70%를 차지하는 시각(視覺)을 통한 방법이 가장 활발하게 사용되었는데, 현대 간호학의 창시자이며 크림전쟁(1853-56) 중 ‘광명의 천사’로 불리웠던 프로렌스 타이팅게일(Florence Nightingale, 1820-1910)도 예외는 아니었다.

크림전쟁 후 영국 정부는 그녀에게 전쟁시 병사들의 사망 요인에 대한 보고서 작성을 의뢰하였고 그녀는 의료통계의 선구자인 윌리엄 파(William Farr, 1807-1883)와 공동으로 작업에 착수하였다. 파는 보고서에 차트와 같은 시각적 요소들을 넣고 싶지 않아했는데 “간결할수록 좋다”라는 보고서에 대한 파의 접근 방식 때문이었다. 하지만 나이팅게일은 “도표는 인구 동태 통계를 눈으로 보여주기 때문에 매우 유용합니다. 이러한 통계를 숫자로 표시하면 이해하기 어렵습니다” 라는 의견과(영국 군대의 사망률 보고서 1페이지, 1858년) 함께 시각적 분석 차트들을 삽입하였고 결국 차트가 큰 영향을 미쳐 병사들을 위한 의료 환경 법 제도가 변화하게 되었다.

2년여 전쟁 기간 동안 병사들이 사망한 요인 – 파란색은 치료가 가능한 질병을 의미함
2년여 전쟁 기간 동안 병사들이 사망한 요인 – 파란색은 치료가 가능한 질병을 의미함

전문적인 통계학자가 아니었던 나이팅게일은 이미 150여년 전부터 데이터 시각화를 통해 사람들을 설득한 것이다. 그런데 150여년이 지난 지금 바로 이런 ‘시각화 자료 없는 간결한 도표 보고서’를 원하는 사람들이 많다는 사실 은 놀랍기만 하다.

데이터 시각화(data visualization)는 데이터 분석 결과를 쉽고 빠르게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정을 말한다. 데이터 시각화의 목적은 도표(graph)와 차트(chart)라는 수단을 통해 정보를 명확하고 효과적으로 전달하는 것이다(Friedman, 2008). 현대 시대를 살아가는 우리는 지나치게 많은 데이터, 정보의 홍수 속에서 버거워하고 있으며 데이터, 정보의 시각화를 통해 우리에게 중요한 정보에 집중하고 문제를 명확히 할 수 있으며 그 해결방안을 쉽게 찾을 수 있다. 빅데이터를 포함한 대용량의 데이터를 분석할때 그 결과 정보의 방대함으로 인해 이제 시각화를 배제한 결과 분석 및 공유는 불가능하게 되었으며, 일반적으로 분석의 마지막 단계에 ‘시각화’ 과정을 두어 데이터 분석을 마무리하고 있다.

필자는 분석과 시각화를 떼어 놓는 것이 아니라, 시각화를 통해 분석한다, 즉 시각적 분석(visual analytics)이라는 표현이 좀 더 타당하고 앞으로 분석 트렌드의 주류가 될 것이라 생각한다. 데이터 시각화가 곧 분석이 되는 예를 보자. 수백 만개의 행이 있는 데이터에서 두 항목의 상관 관계, 패턴이 있는지 알고 싶다. 간단하게 산포도(Scatter plot)로 점을 찍으면, 즉 시각화 작업을 하면 바로 패턴이나 추세, 상관관계를 파악할 수 있다. 물론 통계적인 방법으로 여러 지표들을 산출해 낼 수 있지만, 우선 시각화를 통해 1차적인 분석을 수행할 수 있다. 단지 시각화를 했을 뿐인데 바로 분석이 이루어진 것이다. 여기에는 어떤 통계적인 방법이 쓰인 것도 아니고 복잡한 수식이 들어간 것도 아니다.

데이터 시각화를 통해 바로 상관관계를 확인할 수 있다
데이터 시각화를 통해 바로 상관관계를 확인할 수 있다

과거에는 수천 만개, 수억 만개 이상의 데이터를 시각화하고 상관관계, 패턴을 찾는 것이 강력한 컴퓨팅 환경이 없었기 때문에 불가능했다. 하지만 이제는 어느 누구도 다양한 시각화 도구들을 활용하여 전문가의 도움없이 자신의 컴퓨터에서 시각적 분석을 수행할 수 있다. 오픈소스로 공개된 R이나 D3.js 등을 이용할 수도 있도 태블로(Tableau) 등과 같은 여러 상용 소프트웨어들을 사용할 수도 있다. 기술의 발전이 우리가 보고 인지하지 못했던 새로운 세상을 열어주고 있는 것이다.

데이터, 정보의 시각화는 이제 우리의 생활 곳곳에 스며들고 있다. 정보, 자료, 지식을 구체적, 실용적으로 전달하기 위한 인포그래픽스(Infographics)는 온라인, 오프라인 미디어에서 광범위하게 쓰이고 있고, 데이터 저널리즘(Data Journalism)이라는 이름 아래 기자들은 다양한 데이터를 분석, 특정 사회 현상이나 사건 등을 과학적, 심층적 방법으로 기사화 하고 있다. 이러한 분석기사에 데이터 시각화가 필수인 것은 당연한 일이다. 이뿐만이 아니다. 각종 공공 데이터를 다루고 분석하는 기관들에서도 일반 사람들이 그 분석 결과를 쉽게 이해하고 받아들일 수 있도록 시각화하여 제공하고 있다. 대한민국 정부에서도 공공데이터포털을 통해 다양한 공공 데이터 및 시각화 자료들을 공개하고 있다.

40년에 걸친 200개국의 체중질량지수(BMI) 시각화: https://public.tableau.com/s/gallery/four-decades-prevalence-adult-bmi
40년에 걸친 200개국의 체중질량지수(BMI) 시각화: https://public.tableau.com/s/gallery/four-decades-prevalence-adult-bmi

일찍이 간호사였던 나이팅게일이 인간 생명 연장을 위해 데이터 시각화의 등불을 지폈고, 한스 로스링(Hans Rosling, 스웨덴의 공중보건 의료학자) 등과 같은 데이터 분석 선구자들이 시각화를 통해 인류의 미래와 발전에 대한 길을 제시하고 있다. 데이터를 다루고, 데이터를 분석하고, 데이터를 시각화하는 여러분들의 하나 하나 작은 노력들이 결국 당신의 삶을 윤택하게 만들고 보이지 않는 세상을 보이게 만듦으로서 긍정적인 인류의 발전에 기여하고 있다는 사실을 기억하도록 하자. 데이터는 읽는 것이 아니다. ‘들여다 보는’ 것이다.

김형탁 taky33@yahoo.com 20여년 동안 IT 여러 분야를 넘나들다 지금은 태블로 소프트웨어(Tableau Software)에서 사람들이 데이터를 보고 이해할 수 있도록 돕는 일을 하고 있다. 업계 동향, 시장 흐름의 변화에 대해 관심이 많다. 싱가포르에 살고 있으며 유능한 IT인력들의 해외 진출에 대한 적극적인 옹호론자이기도 하다.

저작권자 © 넥스트데일리 무단전재 및 재배포 금지