데이터 인사이트

데이터 지식공유
나만 알기는 아까운 데이터 지식 함께나눠요.

[데이터 시각화 스토리] DataUSA 개발의 주역, 히달고 교수를 만나다.(상편)

작성자
관리자
작성일
2020-09-16 09:07
조회
62





세계는 지금, 왜 Data Visualization에 집중하나?(상편)

 
  • “DataKorea, 데이터 기반의 스토리텔링 플랫폼 되길”
  • “많은 데이터보다 시선 사로잡는 데이터로 고민해야”
  • Data Visualization, 수치에 그칠 수 있는 데이터에 가치를 부여하는 일
 

 지난 1회 ‘데이터, 시대와 사회의 스토리가 되다’를 소개하며 DataUSA에 대해 본격적으로 알아볼 것을 약속했습니다. 이 차원에서 DataUSA 개발의 주역, 미국 MIT미디어랩의 히달고 교수를 만나서 DataUSA를 만들게 된 배경을 들어보았습니다.


△ 히달고 교수(미국 MIT미디어랩 컬렉티브러닝 그룹)

 

 DataUSA, DataViva(브라질)를 비롯해 세계적으로 자국을 대표할 만한 데이터 시각화 프로젝트가 속속 등장하고 있습니다. 데이터 시각화 분야에서 선도적인 모습을 보여준 DataUSA. 이 사이트를 기획∙개발한 미국 MIT미디어랩의 히달고(Cesar A. Hidalgo) 교수가 지난 2018년 7월 5일 한국을 방문했습니다. 히달고 교수는 ‘수치에 그칠 수 있는 데이터에 의미를 부여하는 일이 바로 데이터 시각화’라고 강조했습니다.

 

세계는 지금 왜 ‘데이터 시각화’에 주목하고 있는지 그 이유를 히달고 교수와 인터뷰를 통해 알아 보겠습니다.

 

Q. 하고 있는 일을 간단히 소개해주세요.

A.  미국 MIT미디어랩(www.media.mit.edu)의컬렉티브러닝그룹의 리더로서 집단학습을 연구하고 있습니다. 팀, 도시, 국가별로 어떻게 집단학습이 이뤄지는지 연구하고 궁극적으로 이것을 시각화할 방안을 연구합니다.

 

Q. 컬렉티브러닝이라는 단어가 생소합니다.

A. 컬렉티브러닝이란 개별 학습이 아니라 팀, 조직, 도시, 국가 등 그룹 차원에서 학습하는 것을 말합니다. 다시 말해 그룹 활동을 통해 연구하고 새로운 경제활동이 이뤄지는 것을 의미하죠. 그 대상은 상품의 수입∙수출 또는 새로운 기술이나 연구 분야가 될 수 있고요. 지식은 사람들이 활동하고 소통하고 그것을 실험함으로써 축적되는 것입니다. 이런 지식들이 쌓이고 또 쌓여서 새로운 경제활동이 일어나고 그 효과가 나타나게 됩니다.

 


△ Hidalgo 교수 인터뷰 영상(사진 클릭)

 

Q. DataUSA, DataChile, DataViVa 같은 사이트가 전 세계적으로 확산하는 배경이 궁금합니다.

A. 정부나 공공기관이 운영하는 수백 개 웹사이트에서 개별적으로 (공공) 데이터를 제공해서는 데이터가 제대로 활용되기 어렵기 때문입니다. 여러 부처의 데이터가 (유통∙활용되지 않고) 그대로 있으면, 단순히 ‘수치’에 불과합니다. 수치에 그칠 수도 있는 데이터에 가치를 부여하는 일이 바로 DataUSA 같은 프로젝트입니다.

 데이터를 통합하는 것만으로도 가치 창출이 이뤄질 수 있지만, 여기다 시각화를 추가해 스토리를 입히거나 통계를 내서 사용자들이 쉽게 활용할 수 있도록 하면 더 큰 가치가 창출됩니다. DataUSA 같은 시각화 사이트는 공공데이터 분야의 ‘2세대 사이트’라고 볼 수 있어요. 우리는 스토리를 넘어서 인사이트를 제공하기 위해 노력하고 있습니다.


△ 브라질의 국가 데이터 시각화 사이트 DataViVa(dataviva.info)

 

Q. 그렇다면 3세대 데이터 사이트는 어떤 모습이 될 것으로 예상하나요.

A.  DataUSA 같은 2세대 사이트를 다시 한 번 정의해 보죠. 앞서 소개했듯이 데이터를 통합해 시각화하고 스토리를 입힌 겁니다. 다음 단계인 3세대 사이트는 여러 통계 툴을 활용해 사용자들이 데이터를 쉽게 분석할 수 있는 환경이 제공될 겁니다.

 또, 4세대 사이트에서는 인공지능(AI)을 활용하게 될 것입니다. 사회적 이슈나 문제 발생의 소지가 있는 지점을 발견해 선제적으로 해결하도록 추천하는 것이 가능해지겠죠. 결국 데이터를 제공하는 것(1세대)에서 스토리텔링(2세대)으로 넘어갔고, 이것을 통계 툴로 분석(3세대)하고, 궁극적으로는 개인 또는 단체가 의사결정을 하는 데 도움을 주는 형태(4세대)로 진화할 거라고 봅니다.

 

Q. 데이터 시각화도 예술의 일부라고 보는지요.

A. 예술(Art)과 데이터는 역사적으로 봤을 때도 늘 연계돼 있었어요. 미술가가 사회 현상을 이해하지 못하거나 시대의 이슈를 캐치하지 못하면, 어떻게 예술을 하고 있다고 할 있을까요? 작가의 시선 또는 생각 없이, 붓과 물감만으로는 예술작품이 나올 수 없어요. 그러므로 붓과 물감을 쓰든, 컴퓨터와 데이터를 쓰든 예술가처럼 접근해야 사람의 마음을 움직일 수 있는 결과물, 즉 작품이 나오게 됩니다. 어찌 보면 데이터가 수집되는 것 역시 예술이라고 볼 수 있어요. 앞으로도 이런 데이터와 예술의 결합은 계속 이뤄질 겁니다.

 


"이용자가 스스로에게 질문하게 하려면, 구체적인 스토리가 꼭 필요합니다. 매일 우리가 부딪히는 어려운 문제도 알고 보면 ‘생각을 어떻게 스토리화하느냐’에 달려 있음을 이해할 필요가 있어요.”

 

Q. 데이터 시각화에서 스토리텔링을 강조했는데요.

A. 사람은 누구나 이야기를 좋아합니다. 우리가 사용하는 언어도 주어∙동사∙목적어로 이야기를 잘할 수 있는 구조로 돼 있지요. 문제는 이야기는 추상적이라는 데 있어요. 결국 ‘그 이야기를 구체화할 수 있느냐?’를 놓고 우리는 늘 고민할 수밖에 없지요.

 데이터 이용자 스스로에게 질문하게 하는 효과를 거두려면, 구체적인 스토리가 필요합니다. 매일 우리가 부딪히는 어려운 문제도 알고 보면 ‘어떻게 스토리화하느냐?’ 이슈라고 이해할 필요가 있어요. 생각해 보세요. 우리가 업무 보고서나 프레젠테이션이션 자료를 만들고, 이메일을 작성하는 모든 일들은 어떻게 스토리를 구성할지 고민하는 작업이자 ‘스토리화’의 과정입니다.

 결국 DataKorea도 사람들이 데이터를 기반으로 스토리텔링을 할 수 있는 환경을 만들어 주는 것이 핵심 가치가 될 것이라고 봅니다. 다음 3회에도 계속하여 히달고 교수와 인터뷰를 통해 DataUSA의 개발 배경에 대해 알아보겠습니다.


△ DataKorea를 개발하는 한국데이터진흥원과 MIT미디어랩 컬렉티브러닝 그룹이 함께했다.





 
데이터 프리존은 비식별화 된 공공·민간 데이터를 연계·분석할 수 있는 이용 환경을 구축·운영하고이를 통해 도출된 분석 결과를 국민 누구나 이용 할 수 있도록 ‘데이터 코리아’를 통해 시각화 하여 제공합니다.