[The Art of Data 1회] 왜 데이터 시각화인가: 모두를 위한 데이터 시각화
송한나의 THE ART OF DATA (1회) :
왜 데이터 시각화인가: 모두를 위한 데이터 시각화
데이터 시각화에 대한 관심은 지난 몇 년간 꾸준히 증가해왔습니다. 그걸 어떻게 알 수 있냐고요? 정말 그런지 Google Trends에서 알아봤습니다. Google Trends에서 data visualization에 대한 관심도를 검색해 보니 [그림 1]과 같이 지난 5년 간의 검색 관심도를 꺾은선 그래프로 보여주네요.
약간의 등락이 있지만 전체적으로는 관심도가 꾸준히 증가하고 있습니다. 그런데 일정한 간격으로 갑자기 관심도가 낮아지는 패턴이 보이네요. 그래프로 보이는 날짜로 추측해보면 대략 매년 12월 시점입니다. 사람들이 12월에는 데이터 시각화에 대해 생각하기 싫어하는 것 같군요. 관련된 검색어에 대해서도 같은 현상이 나타나는지 살펴봅시다.
[그림 1] 시간 흐름에 따른 'data visualization’에 대한 관심도 변화(출처: google trends)
시각화의 이유와 즐거움
데이터 시각화를 하기 위해서는 그 전에 반드시 데이터 분석이 필요하죠. 데이터 분석의 관심도도 한번 검색해볼까요? 마찬가지로 12월에 현저히 관심도가 낮아지는 유사한 패턴을 보입니다. 두 검색결과를 겹쳐보면 확실히 같은 시점에 같은 패턴이 나타나네요. 게다가 데이터 분석에 대해서는 6~8월에도 관심도가 낮아지는 경향이 뚜렷합니다. 그렇다면 이런 가설을 세워볼 수 있을 것 같네요. 많은 사람들이 크리스마스 시즌과 여름 휴가를 떠날 때만큼은 데이터에 대해 생각조차 하기 싫어하는 것일까요?
[그림 2] 시간 흐름에 따른 'data analysis’ 검색어에 대한 관심도 변화(출처: google trends)
[그림 3] 'data visualization’과 ‘data analysis’의 시간 흐름에 따른 관심도 변화(출처: Google Trends)
정확한 이유는 관련된 데이터를 상세히 분석해 보기 전에는 알 수 없습니다. 하지만 우리는 단순히 구불구불한 선 몇 개를 그어보는 것만으로 일정한 경향과 특이한 패턴을 발견했고, 흥미로운 가설을 얻어냈습니다. 바로 이것이 데이터 시각화를 하는 이유이자 즐거움입니다.
데이터 시각화의 힘을 알기까지
데이터 시각화는 인간이 가진 인지능력을 활용해 데이터에 담긴 의미를 발견하도록 하는 일입니다. 그 결과 인간이 이 세계에 대해 더 깊은 통찰력을 얻을 수 있도록 도움을 줍니다. 때로는 그렇게 만들어진 시각적 패턴 자체가 감각적인 즐거움을 주는 감상의 대상이 되기도 합니다.
[그림 4] 데이터 시각화의 구성요소
필자가 데이터 시각화를 시작한 계기도 여기에 있습니다. 대학원에서 시각 디자인을 전공하면서 정보 디자인에 특히 흥미를 느꼈습니다. 기업 현장에서 UX(User Experience) 디자이너로서 오랜 기간 실무를 해오면서도 겉으로 보이는 인터페이스 뒤편에서 어떻게 정보를 조직화하고 어떻게 효과적으로 표현할 것인가가 늘 제 관심을 끌었습니다.
데이터 시각화라는 분야에 대해 알게 되면서 틈틈이 자료를 찾아보며 공부를 하기 시작했습니다. 처음에는 데이터 시각화에서 보여지는 아름다운 추상화 같은 매력에 끌렸다면, 데이터 분석에 대해 알면 알수록 데이터에 숨겨진 의미를 발굴해내는 시각화의 힘이 단순히 보기 좋은 겉모습에 있지 않다는 사실을 깨닫게 되었습니다.
당시에는 국내에서 데이터 시각화라는 개념이 아직 널리 알려지지 않은 시기였기에 실제로 데이터 시각화를 할 수 있는 기회가 없었습니다. 하지만 뜻밖에 좋은 기회가 찾아왔습니다. 바로 빅데이터 열풍이 불어온 것이죠.
시각화에 대한 관심이 실무로 연결
마침 국내 굴지의 ICT 기업 연구소에서 근무하고 있었기에 최신 IT 트렌드에 민감할 수 있었고, 빅데이터는 결코 피해갈 수 없는 거대한 파도였습니다. 너도 나도 빅데이터 분석을 외치기 시작했는데, 빅데이터는 인간의 능력으로 처리할 수 없는 매우 큰 규모의 데이터이기 때문에 원본 데이터를 직접 살펴보는 것은 거의 불가능합니다. 그렇기에 빅데이터를 분석한 결과를 보려면 반드시 데이터 시각화의 도움이 필요해집니다.
[그림 5] 데이터 시각화 서비스 Tableau의 화면
그때까지 데이터 시각화의 필요성을 주장하면서도 현실화할 기회를 좀처럼 만나지 못했지만, 회사에서 데이터 분석과 시각화를 위한 서비스를 만든다는 사실을 알게 되었을 때 조금도 망설일 이유가 없었죠.
덕분에 실제로 데이터 분석 시각화 서비스의 UX 디자인을 할 수 있는 기회를 얻었고, 많은 어려움과 함께 큰 즐거움도 얻을 수 있었습니다. 당시 프로젝트를 위해 대표적인 데이터 시각화 서비스인 ‘Tableau’라는 서비스를 벤치마킹하기도 했는데, 최근 그 회사의 한국 법인이 생길 정도로 국내에서도 데이터 시각화 시장이 커지고 있습니다.
생활 속의 시각화
프로젝트를 진행하면서 데이터 시각화에 대하여 깊은 실무 지식을 얻을 수 있었으며, 이는 데이터 분석의 매력을 체험하는 중요한 계기가 되었습니다. 이어서 데이터 시각화 관련 프로젝트들을 진행하면서 데이터 시각화의 가능성에 더욱 확신을 갖게 되었습니다.
이제는 수년 전 상황과는 달리 데이터 시각화가 대중들에게도 그리 낯설지 않은 개념이 된 것 같습니다. 언론 기사에서도 ‘데이터 저널리즘’이라는 이름으로 시각화와 함께 등장하는 기사들을 손쉽게 찾아볼 수 있습니다. ‘인포그래픽’이라는 이름으로 복잡한 정보를 알기 쉽게 스토리에 담아 그려내는 시각화를 SNS 서비스에서도 자주 접할 수 있습니다.
공공 데이터를 시각화함으로써 시민들이 자신이 살고 있는 도시에 대한 정보를 더 쉽게 이해할 수 있게 되었습니다. 몇 번의 클릭만으로 자신의 이력을 데이터 시각화로 표현할 수 있는 이력 데이터 시각화 서비스까지 등장했습니다. 데이터 시각화는 전문가들이 사용하는 기술이 아니라, 우리 모두가 활용할 수 있는 생활과 밀접한 기술이 되었습니다.
[그림 6] 연합뉴스의 '외고 급부상, 법조계 출신 변화 본격화'에 대한 데이터 시각화 (출처 : http://www.yonhapnews.co.kr/medialabs/special/judges/index.html)
[그림 7] 서울 열린 데이터 광장 '안전한 서울’ 데이터 시각화
데이터 아티스트의 등장
데이터 시각화에 대한 수요가 증가하면서 데이터 시각화를 담당하는 전문가 집단이 등장했습니다. 이러한 데이터 시각화 전문가를 데이터 아티스트(data artist)라고 부릅니다. 데이터 아티스트는 데이터를 분석하는 데이터 사이언티스트와 함께 일하면서 통계적 숫자로 가득한 데이터를 그래프와 스토리텔링을 통해 의미 있는 통찰을 발견하고 청중을 설득하도록 시각적으로 구현하는 일을 합니다.
데이터 아티스트라는 이름에는 예술적 의미와 기술적 의미가 모두 담겨있으므로, 어떤 방향에 중점을 두느냐에 따라 전혀 다른 방식으로 표현됩니다. 경우에 따라 지극히 과학적이고 이성적인 데이터 시각화를 하기도 하고 때로는 매우 예술적이고 감성적인 데이터 시각화를 하기도 합니다. 이것은 전혀 이상한 일이 아닙니다. 예술(art)의 어원인 아르스(ars)는 기술(technology)의 어원인 테크네(techne)와 동일한 의미로 쓰였습니다. 다시 말해 art는 매우 솜씨 있는 기술이나 제작 기술에 정통한 지식을 뜻했지요. 시대가 바뀌면서 18세기 이후에 오늘날 생각하는 예술의 개념이 정립되었습니다.
[그림 8] 올리버 먼데이(Oliver Munday)의 '데이터 플롯으로서의 모나리자'
데이터 시각화를 하기 위해서는 단순히 감각적인 능력이 필요한 것이 아니라, 데이터 분석의 전 과정을 이해하고, 데이터의 의미를 해석할 수 있고, 무엇보다도 데이터를 시각화하는 기술에 대해 정통해야 하는 매우 복합적인 능력을 필요로 합니다. 이런 의미에서 데이터 시각화는 글자 그대로 ‘the art of data’, 즉 데이터의 기술이자 예술이라고 말할 수 있습니다.
어쩌면 데이터 아티스트는 21세기의 레오나르도 다빈치가 되어야 할 만큼 어려운 일인지도 모르겠습니다. 그러나 데이터 아티스트가 만드는 데이터 시각화 덕분에 데이터는 더이상 통계학자나 컴퓨터과학자들만 읽을 수 있는 암호가 아니라, 누구나 쉽게 접근 가능한 대상이 되었습니다.
데이터 시각화가 우리의 생활 속으로 매우 가깝게 들어온 만큼, 우리에게는 데이터 문해력(data literacy)과 함께 시각적 문해력(visual literacy)이 필요합니다. 데이터 시각화는 데이터를 알기 쉽게 요약해 보여주는 편리함도 있지만, 그 과정에서 데이터의 의미를 왜곡시켜 보여줄 수 있는 위험도 공존합니다.
데이터 시각화가 어떻게 이뤄지는지 더 잘 이해할수록, 데이터의 의미를 더 정확히 읽어낼 수 있습니다. 데이터에 맞는 시각화 방법을 어떻게 선택할 것인가? 데이터의 특성을 잘 보여주기 위해 색상을 어떻게 배치할 것인가?와 같은 질문을 통해 데이터 시각화를 더 잘 이해하고 활용할 수 있도록 소개하려고 합니다. 다음 회부터 본격적으로 예술과 기술이 만나는 데이터 시각화의 세계로 여러분을 초대합니다. (다음 회에 계속)
이 칼럼은 디비가이드에 연재한 [송한나의 The Art of Data]를 전재한 것입니다. 원문보기 >
출처 : 한국데이터진흥원
제공 : 데이터 전문가 지식포털 DBguide.net