데이터 인터뷰

DB 노하우, 데이터직무, 다양한 인터뷰를 만나보세요.

“마음을 움직일 데이터 시각화, 스토리텔링에서 찾아라” - MIT미디어랩 히달고 교수

DATA 인터뷰
작성자
dataonair
작성일
2018-11-21 00:00
조회
1816


DataUSA 개발의 주역, MIT미디어랩 히달고 교수 인터뷰

“마음을 움직일 데이터 시각화, 스토리텔링에서 찾아라”

- 시각화는 수치에 그칠 수 있는 데이터에 가치를 부여하는 일
- 주목 받는 서비스 되려면 그래픽은 물론 ‘스토리’를 담아야
- DataUSA, DataViVa 등 데이터가 불러온 변화 앞서 수용
“누구나 데이터에서 가치를 찾지만, 데이터가 갖는 힘을 제대로 전달하려면 스토리가 필요합니다. 스토리텔링은 누구나 갖고 있는 능력이지만, 스토리는 추상적이라는 데 문제가 있습니다. 그 스토리를 구체화할 수 있느냐?를 놓고 우리는 늘 고민할 수밖에 없지요.”

캐나다 출신의 유명 미디어 철학자가 주장한 ‘미디어는 메시지‘라는 말은 일반인에게도 낯설지 않다. 이는 특정 미디어의 등장만으로 사람들은 그 영향권 안에 들어갈 수밖에 없다는 뜻으로 해석되기도 한다. 이 말에 비춰보면, 데이터 시대의 도래만으로 우리는 이미 그 영향권 안에 있다는 뜻이 된다.

데이터가 불러온 눈에 띄는 변화를 목격하고 싶다면, 미국 MIT미디어랩이 런칭한 DataUSA(https://datausa.io)에 관심을 둘 필요가 있다. DataUSA는 미국의 정부나 공공기관에서 공개한 데이터를 취합해 도시별·주별 인구 통계를 비롯해 산업, 교육, 고용 등의 데이터를 스토리 기반으로 시각화해 실시간으로 보여주는 데이터 시각화 플랫폼이자 서비스다.


DataUSA 구축을 주도했던 MIT미디어랩의 히달고(Cesar A Hidalgo) 교수가 지난 7월 초 한국을 방문했다. DBguide.net 편집부는 히달고 교수를 만나 데이터 시각화에 대한 이야기를 나눴다.
(인터뷰: 박세영 글봄크리에이티브 sypark@mustree.com)



in_094.jpg
 
in_095.jpg
△ 미국MIT미디어랩의 히달고 교수



하고 있는 일과 DataUSA를 소개하면.

미국 MIT미디어랩(www.media.mit.edu) 컬렉티브러닝그룹의 리더로서 집단학습을 연구하고 있습니다. 팀, 도시, 국가별로 어떻게 집단학습이 이뤄지는지 연구하고 이를 데이터로 시각화하는 것을 연구하고 있습니다. 진행했던 데이터 시각화 프로젝트 가운데 하나가 DataUSA(https://datausa.io)입니다.

DataUSA는 MIT미디어랩(Media Lab)과 회계법인 딜로이트(Deloitte), 데이터 시각화 벤처기업인 데이터휠(Datawheel)이 공동 개발했습니다. 미국의 정부나 공공기관에서 공개한 데이터를 취합해 도시별·주별 인구 통계를 비롯해 산업, 교육, 고용 등의 데이터를 시각적으로 보여줍니다.

2014년 기준으로 미국에서는 20만 건이 넘는 공공데이터세트가 공개됐지만, 누구나 쉽게 이용할 수 있는 환경은 제공되지 않았습니다. 데이터를 분석하려면 전문 기술이 필요했기 때문에 가치 있는 데이터들이 충분히 활용되지 못했지요. 이 점에 근거해 DataUSA를 기획했습니다. DataUSA는 단순히 보기 좋게 시각화한 것뿐 아니라, 해당 데이터 시각화에 맞는 스토리를 추가한 것이 특징입니다.


in_096.jpg
△ DataUSA 페이지 소개


데이터 시각화에서 스토리를 강조하는 이유는.

데이터 서비스는 일반인을 대상으로 하는 일종의 미디어입니다. 누구나 데이터에서 가치를 찾지만, 데이터가 갖는 힘을 제대로 전달하려면 스토리가 필요합니다. 스토리텔링은 누구나 갖고 있는 능력이지만, 스토리는 추상적이라는 데 문제가 있습니다. ‘그 스토리를 구체화할 수 있느냐?’를 놓고 우리는 늘 고민할 수밖에 없지요. 이게 바로 데이터 문화가 불러오는 ‘사실(fact) 기반의 차세대 미디어가 해결할 과제이기도 합니다.

데이터 이용자 스스로에게 질문하게 하는 효과를 거두려면, 구체적인 스토리는 필수입니다. 매일 우리가 부딪히는 어려운 문제도 알고 보면 ‘어떻게 스토리화하느냐?’의 이슈라고 이해할 필요가 있어요. 생각해 보세요. 우리가 업무 보고서나 프레젠테이션 자료를 만들고, 이메일을 작성하는 모든 일들은 어떻게 스토리를 구성할지 고민하는 작업이자 ‘스토리화’ 과정입니다.


in_097.jpg
△ MIT미디어랩에서 개발한 OEC 사이트(atlas.media.mit.edu). 실시간 생성되는 그래프를 소개하는 글을 제시해 자연어 검색 노출도를 끌어올렸다.


DataUSA 외에도 DataChile, DataViVa 같은 사이트가 전 세계적으로 확산하는 배경을 소개한다면.

정부나 공공기관이 운영하는 수백 개 웹사이트에서 개별적으로 공공데이터를 제공해서는 데이터가 제대로 활용되기 어렵기 때문입니다. 여러 부처의 데이터가 (유통 활용되지 않고) 그대로 있으면, 단순히 ‘수치’에 불과합니다. 수치에 그칠 수도 있는 데이터에 가치 또는 의미를 부여하는 일이 바로 DataUSA 같은 시각화 프로젝트입니다.

데이터를 통합하는 것만으로도 가치 창출이 이뤄질 수 있지만, 여기다 시각화를 추가해 스토리를 입히거나 통계를 내서 사용자들이 쉽게 활용할 수 있도록 하면 더 큰 가치가 창출됩니다.


in_098.jpg
△ 칠레의 데이터 시각화 프로젝트인 DataChile (es.datachile.io)


DataViva 구축 시 선행 사례가 없었을 텐데 어디에 중점을 두었나.

적절한 답이 될지는 모르겠습니다만, 개인적으로 어떤 새로운 영역에 접근할 때 ‘기준이나 규칙이 있어야 한다’는 접근법을 좋아하지 않습니다. 어떤 일을 하기 위한 기술이 주어지면, 우리가 그것을 어떻게 활용할 것인지에 따라 필요한 가이드라인이 충분히 만들어질 수 있습니다. 그런데도 일을 하기도 전에 규칙과 기준부터 만들어 놓으면, 앞뒤가 바뀐 격이 되고 맙니다.

제가 어렸을 때는 ‘워크맨’ 같은 휴대용 오디오 재생기로 음악을 듣고, VHS 비디오 재생기로 영화를 봤습니다. 당시에 그 제품들이 플랫폼이었지요. 이런 플랫폼들이 어떻게 활용되고 콘텐츠가 어떻게 유통되는지에 따라 가이드라인이 만들어지면 됩니다.

데이터 시각화 플랫폼 역시 데이터 포맷을 어떻게 세울지를 중심으로 그 플랫폼(DataViVa)을 설계하면 된다고 봅니다. 설계도 하기 전에 데이터 접근 기준을 먼저 규정해 놓으면 여러 제한사항이 생기고 맙니다. 그러므로 데이터 유통자들과 창작자들이 플랫폼을 어떻게 활용하는지 그 추이를 지켜본 다음에 기준과 규칙을 만드는 것이 좋다고 생각합니다. 결국 DataViVa 같은 플랫폼은 ‘데이터가 어떻게 제시되면 모두에게 도움이 되겠다’는 목표 또는 결과.


DataUSA는 다양한 데이터를 실시간으로 제공하는데, 방대한 데이터 서비스를 어떻게 구성했나.

지도, 대학, 도시 장소, 산업, 직업이라는 5대 카테고리를 유기적으로 결합해 시각화와 스토리를 연출했습니다. 한 대학생이 자신의 직업을 놓고 고민하고 있다고 합니다. 이 대학생이 DataUSA에서 직업을 검색하면, 지도 대학 도시 산업 등이 유기적으로 결합돼 스토리 기반의 데이터 서비스가 제공됩니다. DataUSA만의 ‘멘탈 모델’에 따라 학생이 관심을 가질 만한 주제 몇 가지가 화면에 뜰 겁니다. 이 학생의 반응에 따라 DataUSA는 앞의 5대 카테고리를 유기적으로 결합해 다양한 시각화 기반의 데이터를 제시하게 됩니다. 시각화한 자료를 더 자세히 분석하고 싶다고 느끼면, 그 학생은 CSV 포맷으로 된 데이터를 내려 받을 수도 있습니다. 또한 선택을 놓고 고민하는 직업과 비교(comparing)해 볼 수도 있을 것입니다.


in_099.jpg
△ 데이터 시각화 서비스의 새로운 기준을 제시한 DataUSA 메인 페이지. 지도, 대학, 도시 장소, 산업, 직업이라는 5대 카테고리를 중심으로 스토리 기반의 시각화 서비스를 제공한다.


데이터 시각화 프로젝트 자문을 하면서 역점을 두는 바는.

창의성이 요구되는 데이터 시각화 프로젝트에 대해 ‘이렇게 해야 한다’고 단정하는 것은 조금은 위험하다고 생각합니다. 학생들을 지도할 때도 미리 어떻게 하도록 방법을 알려주는 것을 피하고 있습니다. 교육의 목적은 학생들을 배우게 하는 데 있지요.

배움에 있어 어려운 문제는 ‘학생들 자신이 무엇을 모르는지를 모른다’는 점입니다. 이런 상태에서 교수가 답을 먼저 내놓게 되면, 학생들은 ‘뭐 저런 당연한 얘기를 하고 있지!’ 하고 생각하기 쉽습니다. 그래서 어떤 자료를 제시하여 읽어보게 하여 학생 스스로 답을 찾도록 합니다. 답을 찾아내지 못할 때 해결책을 제시하면, 그 해결책을 가치 있게 생각할 수밖에 없습니다. 결국 실패를 통해 집중하게 하고 제가 제시하는 해결책을 학생들이 이해할 수 있게 합니다. 데이터 시각화 프로젝트 자문 또한 배움의 경우에서 크게 벗어나지 않을 거라고 생각합니다.


DataUSA를 이해하는 데 도움이 될 정보가 있다면.

DataUSA는 오픈소스(OSS) 프로젝트로 진행됐기 때문에 데이터를 제외한 프레임워크 전체를 깃허브에서 내려 받을 수 있습니다. 이를 내려 받아 자신만의 데이터를 추가하고 재구성해 새로운 서비스를 만들 수도 있습니다. (끝)


출처 : 한국데이터산업진흥원
제공 : 데이터 온에어 Dataonair.or.kr