데이터 인터뷰

DB 노하우, 데이터직무, 다양한 인터뷰를 만나보세요.

“데이터를 둘러싼 기술 성숙으로 점프하는 순간 온다” - 생명정보학자 박종화 박사 (상)

DATA 인터뷰
작성자
dataonair
작성일
2018-12-21 00:00
조회
2077


데이터인 인터뷰: 생명정보학자 박종화 박사(상)

“데이터를 둘러싼 기술 성숙으로 점프하는 순간 온다”

- 컴퓨터인 인간이 예측/예언을 잘하려고 하는 일이 프로그래밍
- 데이터를 다루고 프로그래밍하는 사람이 세상 주도한다
- 데이터 접근에 대한 규제 완화는 시대의 패러다임
울산에서 올라온 박종화 박사를 만나기 위해 과천 과학기술정보통신부에서 기다렸다. 오후 4시에 시작된 그와 인터뷰는 늦은 저녁이 되어서야 끝났다. 컴퓨터에 대한 얘기에서 생명, 데이터, 분석에 이르기까지 종횡무진했다. 인터뷰어의 부족한 지식 때문에 받아들이기 어려운 내용도 많이 나왔다.

* 인터뷰: 박세영(글봄크리에이티브 sypark@mustree.com)



in_103.jpg
△ 박종화 UNIST 게놈연구소장


박종화 씨는 1967년 부산에서 태어나 서울대 수의학과를 다니다 영국으로 유학을 떠났다. 영국 케임브리지대에서 생명정보학 박사 학위를 취득하고 미국 하버드대 연구원을 거쳐 한국생명공학연구원, 국가유전체정보센터, 테라젠 바이오연구소 등을 거쳐 2014년 UNIST 게놈연구소장을 맡고 있다. 인간 노화를 극복하려는 바이오해커 가운데 한 명이다.


생명정보학자가 되기까지

아마도 제가 초등학교 6학년이었을 무렵에 컴퓨터라는 단어를 처음 접했던 거 같아요. 컴퓨터가 세상을 바꿀 것이라고 해서 ‘그게 뭘까’ 하고 궁금했어요. 중학교 2학년 때에 한 잡지에서, 누군가가 일본어를 공부하려는데 ‘고옴푸타(コンピュ?タ?)’라는 낯선 단어가 뭔지 이해가 안 됐다는 글을 읽은 적이 있습니다. 당시에, 컴퓨터가 세상을 바꿀 수 있는 존재로서 얼마나 중요한지를 소개하는 글 가운데 하나였어요. ‘앞으로 모든 일을 컴퓨터에서 할 것’라는 내용을 보면서 ‘밥 주문도 자동차 운전도 연애도 컴퓨터로 한다고? 믿을 수 없어!’ 했던 기억이 납니다.

그때부터 컴퓨터에 대해 본격적으로 관심을 갖게 됐어요. 부산 국제시장 미군부대 근처의 서점에서 영문 컴퓨터 잡지를 사서 거기에 나오는 코드를 일일이 입력/확인해 보면서 배웠죠. 저는 어릴 때부터 숙제 안 하고 철학책을 읽곤 했던 아이였어요. 나에게 컴퓨터는 또 하나의 관심거리가 된 거죠

우리집이 넉넉했던 것은 아닙니다. 부산 영도구 청학동이라고 하여 판잣집 달동네였습니다. 아버지께서 당시에 사진을 매우 좋아하셨어요. 없는 살림에도 비싼 카메라를 구입하고 암실을 만들어 흑백사진을 직접 인화하는 특이한 사람이었죠. 제게 비싼 컴퓨터를 무리해서 사주셨을 겁니다. 고등학교 1학년이었던 1983년에 미국이 게놈(DNA)을 해독한다는 뉴스가 돌았어요. 이때쯤 PC를 갖고 있는 사람들이 꽤 늘어났을 때죠.

어렸을 때부터 저를 포함해 우리 집안은 동물광이었어요. ‘새만 쫓아다니면 밥이 나오냐, 떡이 나오냐’ 하고 어머니께서 저를 이해할 수 없다고 하셨던 말씀이 기억납니다. 컴퓨터를 좋아하고 동물을 좋아하다 보니 많은 동물 게놈지도를 만들게 되지 않았나 합니다. 컴퓨터를 공부하고 싶었고 생명, 특히 인간 노화(老化)가 궁금했습니다. 수의학과에 들어갔다가 그만두고 영국으로 유학을 떠나 본격적으로 생정보학(생명정보학) 분야를 연구하게 됐습니다.




데이터 분석과 데이터 민주화

인류 역사에서, 원래부터 데이터는 중요했고 IT에서 핵심이었어요. 다만 타이밍이 있습니다. 과거 컴퓨터 운영체제나 CPU가 사람들의 관심을 끌었던 때가 있었습니다. 인터넷이 나오고 스마트폰이 대중화되면서 데이터를 둘러싼 기술이 성숙해졌죠. 정보처리 에너지가 쌓인 것입니다. 이렇게 되면 점프하는 순간이 옵니다. 하드웨어와 소프트웨어를 합친 것을 IT라고 봤을 때, 콘텐츠 즉 데이터를 정밀하게 유기적으로 분석할 수 있는 타이밍이 왔어요.

인공지능이요? 그것도 별게 아닙니다. 인공지능(AI) 방법론은 어렵지 않습니다. 저는 한국의 젊은이들에게 겁먹지 말고 AI 방법론을 쓰라고 말하고 싶습니다. 실무 영역에 AI를 적용하면 별거 아닌 수학 공식임을 알게 됩니다. 저는 어릴 때 뉴럴 네트워크를 독학하면서 어렵다고 생각했는데, 그런 생각이 저를 더 궁지에 몰아넣는다는 것을 알게 됐어요. 빅데이터라는 용어는 맞지 않아요. 데이터는 물리적 존재가 아니므로, 즉 헤아릴 수 없으므로 빅데이터라는 용어는 정확하지 않고, 그 핵심은 물리적인 양이 아니라 그 복잡도입니다.


in_104.jpg


“서로 다른 데이터를 융합해 패턴을 발견하는 것이 데이터 분석이고, 이것이 보편화되면 데이터의 중요성은 부각될 수박에 없습니다.”

데이터 분석은 이질적 데이터에서 패턴을 도출하는 일입니다. 오래 전부터 데이터를 분석해왔기 때문에 나름대로 예측이 되는데요. 업계의 특수한 데이터가 사회를 움직이는 시대가 오고 있습니다. PC가 등장하면서 컴퓨팅 보편화 시대가 열렸습니다. 이어서 인터넷이 대중화되면서 프로그래밍의 보편화 시대가 열렸고요.

프로그래밍의 보편화는 데이터의 보편화, 즉 데이터의 민주화를 불러오고 있어요. 자신에 대한 데이터를 소유하고 데이터에 접근할 권리가 데이터의 민주화입니다. 자신의 금융, 의료, 건강관련 데이터도 집에서도 처리할 수 있는 데이터 민주화가 오고 있습니다. PC와 인터넷이 보편화되면서 집에서도 수퍼컴퓨터를 이용할 수 있게 됐지요.

서로 다른 데이터를 융합해 패턴을 발견하는 것이 데이터 분석이고, 이것이 보편화되면 데이터의 중요성은 부각될 수박에 없습니다. 현재 우리나라 정부는 우리 사회를 견인할 주역으로서 데이터에 관심을 두는 모습입니다. 이를 위해 사회적으로 데이터 민주화가 필수적으로 이뤄져야 합니다.

데이터 접근에 대한 규제를 완화해 국민 스스로에게 자기 결정권을 줘야 한다고 봅니다. 예를 들어 국내에서는 자신의 게놈 데이터를 보고 싶어도 쉽게 볼 수 없습니다. 헬스 임상 데이터가 공유되면 나라가 무너질 것처럼 생각하는데 인터넷이 군사 및 과학 연구망에서 일반망이 되었듯이, 연구자 중심의 데이터가 민주화되는, 즉 공개와 공유가 되는 시대로 가고 있습니다. 과거 고해상도 종이지도나, 인터넷 지도 서비스는 우리나라에서 남북이 대치되고 있어서 공개하지 않았습니다. 하지만 구글이 지도 서비스를 하면서 공개됩니다. 개인적으로 모든 기술 문제는 곧 우리의 마인드 문제라고 봅니다. 권총이나 게놈 빅데이터가 좋고 나쁜 게 아니라, 우리가 어떻게 그것을 이용하는가가 문제입니다.


in_105.jpg

주차된 도심형 SUV 자동차 초기 모델을 발견하고 이 모델 예찬론을 펼쳤다. 도색 방법에 따른 분위기 변화도 꿰고 있었다. 이 차의 원년 모델 두 대를 보유하고 있다고 한다.


개발자와 일하는 자세

편하게 IT 인력이라고 표현하겠습니다. 제가 만났던 IT 인력은 크게 세 가지 유형이었습니다. 프로그래밍을 용병적으로 하는 사람, 팀장처럼 일하는 사람, 문제를 해결하기 위해 새로운 방식을 적용하는 사람이라는 세 가지 유형이 그것입니다. 흔히 세 번째를 PM급 인력이라? 해야?? 주면 일을 매우 잘합니다.

하지만 게놈정보 같이 유기적 빅데이터 분석에는 그렇게 일을 할당하기 어렵습니다. 따라서 용병적으로 프로그래밍하는 사람은 데이터의 속성과 고객의 속성을 몰라서 잘하지 못할 가능성이 있습니다. 그들이 왜 그렇게 반응할까? 하고 고민해본 적도 있어요. 기술력이 부족해서가 아니라 고객의 니즈를 생각하려 하지 않기 때문이라는 결론을 내렸습니다. 나이나 경험의 문제도 아니라고 봅니다.

고객을 이해하려고 하지 않다 보니 고객과 갭이 생기고 나중에는 서로 힘들어지고 불만족하게 됩니다. 만약 박물관에서 데이터 분석을 한다면 동식물과 미생물, 화석 등의 데이터를 이해할 필요가 있습니다. 고래, 박쥐, 사람, 호랑이 게놈 데이터를 보면 숫자로 이뤄진 것은 동일합니다. 그럼에도 데이터를 들여다보면, 무슨 데이터이고 고객이 원하는 것은 무엇이겠구나 하는 것을 알아야 합니다.

데이터 분석을 하려면 문제를 해결하려는 PM급 마인드로 접근할 필요가 있습니다. 그렇게 접근하면, 해당 도메인에 대해 많은 것을 배우게 되고 일이 즐거워집니다. 단순 상품 전달식의 택배 업무 같은 코딩 작업을 비하하는 것이 아닙니다. IT인들이 택배 업무처럼 주어지면, 처리 전달하는 정형화한 업무만 하려는 이유는 고객이 그렇게 단순하게 요청했기 때문이라고 문제를 고객에게 전가하는 경향이 있더군요. 고객이 개발 업무를 이해하지 못한 채 황당한 요구만 한다는 것이죠. 분명 그런 지점이 없지 않을 것입니다. 그럼에도 주어진 일만 하기보다는 콘텐츠, 즉 속성에 관심을 가지면 일이 훨씬 즐거워질 거라고 봅니다. 그래야 데이터도 제대로 정의하고 일을 잘할 수 있게 됩니다. (다음 회에 계속)


출처 : 한국데이터산업진흥원
제공 : 데이터 온에어 Dataonair.or.kr