데이터 인터뷰

DB 노하우, 데이터직무, 다양한 인터뷰를 만나보세요.

데이터 사이언스 위한 전문인력 없이는 빅데이터도 없다 - 전용준 리비젼컨설팅 대표

DATA 인터뷰
작성자
dataonair
작성일
2014-10-27 00:00
조회
3408




전용준 리비젼컨설팅 대표

데이터 사이언스 위한 전문인력 없이는 빅데이터도 없다

in_141027_01.jpg

‘빅데이터’라는 단어는 언젠가부터 IT 분야에 국한되지 않고 우리 사회 곳곳에서 보편적으로 쓰이기 시작했다. 이제는 빅데이터를 분석하고, 활용하며, 접목시킨다는 표현을 다양한 분야에서 흔히 접하게 된다. 그러나 그게 과연 빅데이터가 맞는지, 또 그만한 가 치를 제공할 수 있는지에 대해서는 대부분 물음표가 붙는 것도 사실이다. 본지에‘스몰데이터의 역습’기고를 통해 데이터에 대한 새로운 시각을 선보인 바 있는 전용준 리비젼컨설팅 대표는‘데이터 사 이언티스트’가 없이는 빅데이터도 없다고 주장하며, ‘데이터 사이언스’를 위한 전문인력 양성의 필요성을 강조하고 있다. 20년간 데이터 분석에 매진해온 그의 이야기에 귀기울여본다. 팽동현 기자 dhppp@itdaily.kr

아주대학교에서 경영학 박사 학위를 받고 미국 워싱턴대학교 에서 방문학자(Visiting Scholar)로 연수한 바 있는 전용준 박사 는 경영학의 인공지능 분야를 전공하면서 데이터와 인연을 맺었 다. 예측 모델에 인공지능을 탑재하기 위해 통계 프로그램을 직 접 만들고 여러 알고리즘을 적용해보는 과정에서 데이터를 접했 던게계기가됐다.

이후로 전용준 박사는 20년간 유통, 서비스, 금융, 공공, 제조, 통신, 의료 등 다양한 분야에서 데이터를 다뤄왔다. CRM에서의 고객 분석에서 출발, 데이터마이닝과 예측 모델링 등을 주로 다 루며대량데이터에대한고급분석과컨설팅을수행해왔다.

현재 전용준 박사는 데이터 분석 전문 컨설팅 회사 리비젼컨설 팅의 대표를 맡고 있으며, 경희대학교 디지털경영MBA 빅데이터 전공 책임교수을 겸임하고 있다. 또 정보화진흥원(NIA) 등 공공 기관의정부3.0과빅데이터에대한자문에도참여중이다. 데이터 분석 전문가인 그로부터 들은 여러 이야기를 일문일답 형태로 정 리했다.

빅데이터란 무엇이라고 보나.

무엇이 빅데이터고, 무엇은 빅데이터가 아니라고 딱 잘라서 이 분법적으로 나누기는 어렵다. 빅데이터는 양(Volume)만을 지칭 하는 것이 아니다. 얼마나 다양하게 결합하는지(Variety), 얼마나 빨리 처리하는지(Velocity)도 관건이다. 이 3가지 V를 동시에 만 족시키는 것은 아직 나타나지도 않았다. 데이터는 지속적으로 커 질것이자명하며, 진정한‘빅’은앞으로접하게될것이다.

CRM과 빅데이터의 관계도 같은 맥락으로 바라볼 수 있다. 분 석의 범위와 기술은 늘어났지만, 고객과 시장에 대한 인사이트를 얻는데 중점을 두는 것은 마찬가지기 때문이다. 빅데이터는 CRM의 연장선상에 있다는 의견에 동의하며, 이를 시기적으로 나누는이분법적인시각또한의미없다고본다.

요즘에는 소셜 빅데이터를 활용했다는 사례를 종종 접하는데, 데이터를 수집할 수 있는 개방형 SNS 중 널리 쓰이는 트위터도 활용 가능한 데이터는 폐쇄형 SNS인 페이스북의 20분의 1 수준 이다. 대개 중요하거나 개인적인 정보는 개방을 꺼리는 등 SNS 의 형태별로 사용 의도도 다르므로, 어느 한쪽만 분석해서는 오 류를 범할 수 있다. 또 예측을 위해서는 기초적인 탐색에서 그칠 게아니라모델링이포함된고급분석까지이뤄져야한다.

빅데이터 열기, 얼마나 갈까

빅데이터라는 단어가 국내에 알려지기 시작한지 3년여가 흘렀 다. 그배경에는IT 경기를위한측면도있었기때문에, 또하나의 비즈니스 트렌드 용어로 치부될 수도 있다. 그간 빅데이터에 대 한 과장이나 왜곡된 측면도 많았던 반면, 이윤을 남기는 등의 가 시적인 성과는 거의 없다시피 했다. 이제 정리되기 시작해, 비현 실적인기대감은점차줄어들것으로본다.

국내의 열기도 정부3.0 등 공공 분야를 제하면 그리 뜨겁다고 할 수 없는 상황이며, 이마저도 경험과 전문성의 결여로부터 비 롯된 근시안적인 시각과 허술한 계획으로 인한 문제를 안고 있 다. 성공사례나 실질적인 비전이 없다보니 민간에서는 투자에 소 극적이게 되고, 그저 다른 곳에서 먼저 해보기를 기다리는 형국 이다.

사실 우리가 준비가 덜된 것일 뿐, 해외에서는 인식이 다르고 성공사례도 존재한다. 아마존의 경우 국내에서는 로그데이터를 버리기 일쑤였던 10년 전부터 이를 활용해왔고, 총 직원 5000명 규모의 링크드인은 데이터 분석을 담당하는 40여명만으로 약 3 억명의 회원들의 다양한 데이터를 소화할 정도로 기술과 역량을 쌓아왔다. 우리는 출발과 확산이 2~3년쯤 늦은 편이고, 미국과 는 그 이상의 격차를 보인다. 개인적으로는 해외 성공사례를 국 내에소개해전반적인방향성을찾는데도움을주고싶다.

한편, 앞으로는 빅데이터보다 데이터를 다루는‘데이터 사이 언스’라는 구체적인 실체와, 이를 맡는‘데이터 사이언티스트’에 대한 관심이 꾸준히 늘어날 것으로 본다. 가트너도 최근‘하이프 사이클(Hype Cycle)’발표를 통해 빅데이터보다 늦게 대중화된 단어인데이터사이언스가오히려더 빠르게정상적인궤도에오 를것으로전망했다. 사물인터넷(IoT)의발달에힘입어데이터사 이언스는 향후 수십 년 내에 현재 사람이 맡는 일과 역할의 90% 이상을재정의할것으로보인다.

데이터 사이언스의 주체, 데이터 사이언티스트는 어떤 사람인가.

데이터 사이언스의 전부라할수있는데이터사이언티스트는 고급 데이터 분석가라고생각한다. 데이터 사이언스자체가다양 한 모습으로 이뤄지므로, 데이터 사이언티스트도 획일적인 모습 을 지칭하기 어려운 점이 있다. 수행하는 분석에 따라 일회성 (One-Off) 분석, 운영성 시스템(Production System) 개발 등 크 게2가지분야로나눌수있다.

먼저, 일회성 분석은 사람들이 그때그때 궁금해 하는 것들에 대한 이유나 상황을 파악하는 용도로, 일정하지 않고 매번 다른 내용과 과정을가진다는특징이 있다. 경영컨설턴트가데이터분 석도 할 수 있는 셈으로, 컨설팅적인 요소가 강한 만큼 인사이트 가 중요하다. 개인적으로는 이 분야에 가까운 일들을 주로 다뤄 왔다.

반면, 운영성 시스템 개발은 일정 형식의 분석이 지속적으로 반복되는 형태로, 자동화된 시스템이 분석을 수행하는 방식이다. 아마존의 개인화된 상품 제안이나, 신용카드사의 승인시스템에 들어가는 비정상건 식별 등을 예로 들 수 있다. 기계적인 자동 처 리를이용한다는측면에서툴개발의성격을띤다.

이 두 가지 분야는 상당히 다른 업무를 수행하며, 필요한 기술 과 배경지식도 다를 수밖에 없다. 더욱이 오픈소스 환경으로 바 뀌어가는 현 세태에서 개인이 양쪽 분야 모두 제대로 갖추기는 현실적으로어렵다. 결국앞으로는서로간의 이해를바탕으로각 자의 주특기영역을맡아 협력하는데이터사이언티스트팀이데 이터사이언스의주역으로떠오를것이다.

in_141027_02.jpg

데이터 사이언티스트, 직업으로서 전망은 어떤가.

국내에서는아직데이터사이언티스트를찾기쉽지않으나, 향 후 중요한 직종으로서 이들을 찾는 곳이 늘어날 것이다. 분석도 점차 자동화되는 추세라 세간에서 기대하는 수요만큼은 아닐 수 있지만, 데이터의 종류와 양이 계속 늘어나고 있을 뿐 아니라 대 부분의분야에서이들을필요로하게될것이기때문이다.

다만, 데이터 사이언티스트를 장밋빛으로만 바라보는 것은 지 양해야 한다. 수입부터 살펴보면, 국내에 아직 연봉 1억 이상은 별로 없는 것으로 알고 있으며, 오히려 경영컨설턴트의 평균 연 봉이 더 높을 것이다. 미국의 경우 박사 마치고 초임으로 2~3억 을 받는다는데, 이 가치가 크기 때문이다. 또한, 상당한 업무량을 소화하는 경우 가 잦으며, 업무 자체도 집중을 요하는 구석이 많아 예민해지기 쉽다. 즉, 적성에맞아야한다.

데이터 사이언티스트가 되면 새로운 아이디어로 스타트업을 만들어 스스로 기회를 만들 수도 있고, 지분을 받고 합류해 성공 할 수도 있다. 국내에서 연봉이 높지 않다는 것은 국내 시장이 작 고낙후돼있다는것과 더불어우리 인력들의경쟁력이낮다는것 을의미할수도있다.

데이터 사이언티스트가 되기 위해 필요한 자질은.

비즈니스적인 감각, 자제력(Self-Control), 인내심, 탐구심, 특 정분야 업무지식(Domain Knowledge) 순으로 중요하며, 이 가 운데 부족함이 있으면 지속하기 쉽지 않다. 통계에 대한 기본 개 념 정도는 갖추는 게 좋으며, 고급 통계 부분은 선택적이다. 나아 가성공을거두려면조직내외에서자신의계획을이행하고결과 를적용하는실행력이바탕이돼야한다.

데이터를 바라보는 관점은 이론과 실제를 겸비하는 것을 권장 한다. 학업만으로는 실제상황에서 발생할 수 있는 여러 변수에 대한 대처를못하고, 현업에서는일정기간내 빨리자동화시키는 것에만 매달리는 매너리즘에 빠져 품질을 높일 수 있는 부분을 간과하기쉽다. 이에 대해서는정부에서나서서산학협력과정보 공유의 장을 마련해줘야 하며, 학문끼리와 산업분야끼리도 교류 할필요가있다.

in_141027_03.jpg

데이터 사이언티스트 양성 프로그램이 많아지고 있는데.

단기 교육부터 대학원 프로그램까지 많은 교육과정들이 생기 고 있는데, 문제는 양이 아니라 질이다. 데이터 사이언티스트가 무엇이고, 어디에 필요하며, 어느 정도가 돼야 경쟁력을 갖추는 지 등 구체적인 부분에 대한 이해가 부족하다. 이와 같은 맥락으 로 최근 유행하는‘머신 러닝’에 대해서도 우려하는 목소리가 들 려온다.

무엇보다 학생들을 가르칠 선생님이 없다는 게 가장 큰 문제 다. 심지어 데이터를 제대로 다뤄본 적도 없는 이들이 양성 프로 그램에강사로참여해자신도잘 모르는부분을미취업자나대학 생들에게 가르치는데, 그렇게 몇 달 배운다고 무엇이 될 수 있겠 으며, 어떤 효과를 거둘 수 있겠는가. 경험과 전문성을 바탕으로 선생님역할을맡을수있는전문인력이시급하다.

개인적으로는 이를 위해 속칭‘슈퍼 데이터 사이언티스트 아 카데미’라는것을준비하고있다. 북미기업등에서실력있는데 이터 사이언티스트들을 선생님으로 스카웃, 국내에서 데이터 분 석에대한이론적또는실무적인기초를지닌이들부터세계적으 로 통할만한실력을갖출수 있도록글로벌프로젝트도진행하며 양성하는 것이다. 당장 국내에서는 선생님을 구할 수 없으므로 스카웃부터적잖은돈이 들겠지만, 이렇게양성된 데이터사이언 티스트들은그보다큰가치를창출할수있으리라여긴다.

인터뷰를 마치면서, 20년간 데이터 분석을 맡아왔는데 힘들지 않냐고 묻는 기자의 질문에, 전용준 박사는‘천직’이라고 답하며 소탈한 웃음을 보였다. 컨설팅 업무는 물론, 데이터 관련 강의, 공공기관의자문·평가, 향후목표인 후진양성까지 다양한활동 을 펼치며 바쁜 나날을 보내고 있는 전 박사지만, 그 와중에도 짬 짬이 기타를 연주해 유튜브에 올리고 곡을 만들기도 하는 등 멋과 여유 또한 잃지 않 고있었다.

한편 전용준 박사는 오는 10월 8일‘데이 터 사이언티스트 컨퍼런스’에 대한 기대감 도나타냈다.“ 데이터사이언스라는단어를 알리고, 데이터 사이언티스트에 대한 이해 를돕고싶다”고밝힌전박사는‘글로벌시 장에서 데이터 사이언스의 실제 모습: 상상 과현실’을주제로발표에나선다.“ 막연한 환상을 깨주겠다”고 다짐하는 모습은 새삼 그의‘천직’이 무엇인지 깨닫게 해줬 다.

 

출처 : 컴퓨터월드 10월호

제공 : DB포탈사이트 DBguide.net