데이터 인사이트

데이터 지식공유
나만 알기는 아까운 데이터 지식 함께나눠요.

[데이터 사이언티스트 인터뷰] 분석 기술과 소통력을 두루 갖춘 전문가 … 해외 시장으로 시각 넓혀야

작성자
관리자
작성일
2020-09-17 17:27
조회
131

데이터 분석 전문가 인터뷰

분석 기술과 소통력을 두루 갖춘 전문가 … 해외 시장으로 시각 넓혀야



 

▲ 전용준 리비젼컨설팅 대표, 경영학 박사(인공지능응용전공)

 



* 이 글에서 데이터 사이언티스트는 데이터 분석가·시각화 전문가·통계 분석가·프로그래머 등을 포괄한 개념으로 사용한 용어다. _편집자 주


Q: 현재 하는 일을 소개하면.

비즈니스 컨설팅 업무를 주로 하며 컨설팅 과정에는 데이터 분석이 많이 포함된다. 근래에 대용량 데이터 분석의 인기로 데이터 분석가에 대한 관심이 올라가서 (데이터 분석가에 대한) 강연도 한다. 정부 또는 공공기관의 빅데이터 관련 평가-자문위원으로도 활동하고 있다. 이 측면에서 데이터 사이언티스트로 통하는 거 같다.


Q: 어떤 계기로 데이터 분석 업무를 하게 되었나.

대학원에서 인공지능 응용 분야를 연구했다. DB 설계부터 분석 방법을 공부했는데, 대학원에 재학하고 있을 때부터 데이터 분석 실무자로서 활동을 병행했다. 지금으로부터 10년 전에, 교환교수 프로그램으로 아마존과 마이크로소프트가 있는 미국 시애틀에 갔는데, 그때도 이미 데이터를 지우지 않고 축적한다는 얘기를 들었다. 미국에서는 이미 10년 전부터 남이 만들어 놓은 상용 분석도구로 분석하지 않고, R에서 패키지로 제공되는 것 같은 모듈들을 직접 개발해서 쓰고 있었다. 다시 말해, 데이터 마이닝을 하기 위해 SAS나 SPSS 같은 도구를 구입하는 게 아닌, 필요한 특수 기능을 직접 만들어서 쓰고 있었다. 이것은 곧 슈퍼 A급 분석 엔지니어와 분석도구 개발자들을 이미 확보?운영하고 있었다는 뜻이다.


Q: 데이터 사이언티스트란 어떤 일을 하는 사람인가.

말 그대로 데이터 분석 관련 전문가이지만, 정확하게 어떤 재능을 갖고 어느 영역까지 커버할 수 있느냐를 놓고는 아직 혼란스러운 거 같다. 크게 분석 시스템을 개발하는 전문가와 분석을 하는 전문가로 양분된다. 참고로 빅데이터 시대 도래와 함께 데이터 사이언티스트는 “분석 도구 활용 기술은 물론, 통계와 프로그래밍, 데이터 시각화에 대한 이해까지 하는 사람”으로 묘사되고 있다. 미국에서 데이터 분석 전문가 컨퍼런스가 열렸는데, 참석자들 스스로 ‘이 정도의 능력을 갖춘 사람이 누구냐?’고 궁금해 했다고 한다. 결론은 그런 사람은 없다는 것이었다.


Q: 데이터 사이언티스트란 데이터 분석을 둘러싼 여러 전문가들을 통합해 부르는 용어라는 말인가?

질문에 답하기 전에, 데이터 분석을 하려면 앞서 나열한 관련 기술이 모두 필요하다는 말을 하고 싶다. 분석 프로젝트는 혼자서 하는 것이 아니라, 개발 프로젝트처럼 팀 단위로 수행된다. 적게는 3명에서 많게는 5~6명으로 팀을 꾸려 앞서 언급했던 프로그래밍과 분석, 통계, 시각화 등을 처리한다. 결국 혼자가 아닌 팀이 하는 일이다. 분석만 놓고 본다면, 기존 지난 10~15년 전으로 거슬러 올라가더라도 지금과 크게 다르지 않았다. 다른 점이라면, 지금처럼 데이터가 많지 않았고, 외부 데이터까지 분석하지 않았던 것이다. 더불어 하둡 에코 시스템 같은 오픈소스 소프트웨어(OSS)가 등장하면서 SAS나 SPSS 같은 상용 분석 패키지를 다루는 사람이 전문가로 통하던 시대에서 R 같은 무료 SW 등장으로 분석의 스코프가 넓어졌다. 또한 자바와 C, 파이썬 같은 프로그래밍 언어로 분석 환경을 개발하거나 분석할 데이터를 전처리하는 데이터 엔지니어도 등장했다.


Q: 데이터 사이언티스트가 하는 일의 특징은.

앞서 소개했듯이 혼자서 분석 프로젝트를 할 수 있는 데이터 사이언티스트(이하 DS)는 없다. 군대의 최소 단위가 분대이듯 DS들도 팀 단위로 움직이다. 대용량 데이터 처리를 담당하는 사람, 앱 프로그래머, 시각화 전문가 등으로 역할이 세분화가 되고 있다. 빅데이터 분야에서 처리에서 분석까지 혼자서 할 수 있는 멀티플레이어 시대는 지나갔다. 하지만, 시각화 전문가로 활동하겠다고 하더라도 데이터 사이언스의 다양한 영역을 공부해야 한다. 그 이유는 소통을 위해서다. 분석 프로젝트도 영화 제작 프로세스와 비슷하다. 주연 배우가 돋보이도록 감독부터 조연 배우, 음악, 분장 등 수많은 스텝이 필요하다. 데이터 분석가는 영화배우로 볼 수 있고, 프로젝트 매니저는 영화감독으로 볼 수 있다. 분석 모델을 개발할 때, 3~5명으로 팀을 구성해 한다. 고객이탈 예측 모델을 만든다고 했을 때, 프로젝트 매니저가 고객과 소통하면서 컨트롤타워로서 역할을 하면서 프로젝트를 진행한다.


Q: 실제 분석 프로젝트는 어떻게 이뤄지는가.

대부분 3개월 전후 프로젝트로 이뤄진다. 모델 개발일 경우, 3~5명의 분석가팀이 고객 측의 실무 담당자들과 프로젝트 수행을 위한 연합팀을 구성한다. 데이터 분석은 시스템 자체가 아니라, 업무에 맞는 모델을 개발하는 것이므로 컨설턴트가 합류하고, 업무에 따라 인사팀 또는 마케팅팀 등의 현업 실무자가 참여한다. 데이터 분석 분야에서 일해보지 않은 사람은 처음에는 문서화 작업을 주로 한다. 줄을 맞추거나 하루 종일 그래프를 그리거나 파워포인트를 만드는 일을 한다.


Q: 데이터 분석가는 기술자로 봐야 하나, 전문 컨설턴트로 봐야 하나.

상황에 따라 다르다. 전체 업무의 20%를 특정 영역(Domain) 실무자로서의 역할과, 나머지 80%를 분석 기술자로서 일하는 사람도 있고, 그 반대로 실무자 역할을 80%를 하면서 분석 기술자로서 역할을 20%를 하는 사람도 있다. 축구 선수의 예를 통해서 보면, 데이터 분석 전문가의 역할을 쉽게 이해할 수 있다. 박지성 선수 같은 공격과 수비까지 능수능란한 멀티 플레이어가 있는 반면, 이동국 선수처럼 스트라이커 역할을 주로 하는 데이터 분석 전문가가 있다.


Q: 데이터 사이언티스트의 몸값이 비싸다고 하는데.

현재 국내 대부분의 기업들은 데이터 분석 전문가들을 데려다가 무엇을 해야 할지 모르는 상태라고 본다. 데이터 분석에 돈을 쓸 회사도 드물다. (데이터 분석가) 채용 공고를 보면 알 수 있다. ‘데이터 분석가 10만 양병설’ 등 정부 차원의 적극적인 대처가 일종의 데이터 사이언티스트에 대한 환상을 일으켰다고 봐도 무리는 없다. 데이터 분석가로서 현업에서 느끼는 체감 온도는 아직 높지 않다. 현재로서 컴퓨터의 고향이랄 수 있는 북미 지역에서 데이터 분석가 수요가 많고 빠른 속도로 증가하고 있다. 북미 시장 자체가 크고 세계 시장의 데이터 분석가 공급처이기 때문이다.


Q: 한국에서 준비해 북미 시장에 진출할 수도 있지 않을까.

데이터 사이언티스트의 역량에 달려 있지 않을까 싶다. 프로야구 선수를 보라. 세계적으로 뛰어난 선수들이 미국 메이저리그에 몰려 있지 않은가? 2부 리그에 있다가 메이저 리그를 거쳐 올스타에 선발되면 그야말로 ‘대박’이다. 일반적으로 데이터 분석 영역에서는 한 명의 슈퍼스타 데이터 사이언티스트가 1000명의 일반 데이터 사인언티스트 역할을 해 낼 수 있다. 아무도 개발하지 못했던 새로운 분석 알고리즘을 내놓고, 비디오 데이터까지 분석할 수 있는 환경을 내놓을 수 있는 사람이라면, 그 영향력은 상상하기 어렵다. 기술 개발뿐 아니라 분석 응용 능력도 중요하다. 예를 들어 긴 URL을 단축시켜 표현하는 알고리즘을 내놓은 데이터 분석가가 있었는데, 그 데이터 분석가는 해당 분야의 넘버원이 되었다. 그 주인공이 미국의 비틀리라는 회사에 소속된 힐러리 메이슨인데, 그는 데이터 사이언스 분야의 록스타로 통한다.


Q: 해외에서도 통할 정도의 수퍼 데이터 분석가가 되려면 어떤 준비가 필요한가.

당연한 얘기지만 영어식 사고 방식과 문화를 이해하고 있어야 한다. 박찬호 선수가 미국에 진출해 영어를 해야 했을 때, 한국 사람들을 만나지 않았다고 한다. 그런 투지를 갖췄다면, 해외 시장에 진출할 수 있을 것이다. 더불어 데이터 분석 업무의 절반은 소통이다. 인도는 가장 많은 고급 데이터 분석가들을 배출하는 국가로 통한다. 이렇게 될 수 있었던 배경에는 교육뿐 아니라 소통, 즉 영어에 능통한 사람이 많다는 것도 큰 힘이 되었다고 한다. 굳이 미국에 진출하지 않더라도 인도에서 미국의 데이터 분석 업무를 할 수 있다. 하나의 예로서 독일의 한 자동차 회사가 인도의 데이터 분석가에게 분석을 의뢰하면, 프로세스와 분석은 인도에서 이뤄진다. 대학생으로서 데이터 분석가가 되고 싶다면, 장기적 안목으로, 해외 진출을 염두에 두고 준비할 필요가 있다.


Q: 미국의 DS 육성 교육에서 눈에 띄는 점이라면.

일단 다양한 종류의 프로그램이 존재한다. 일례로, 포스닥(Post-Doc) 프로그램을 통해 데이터 사이언티스트를 육성하는 전환 교육을 시켜 도메인 지식과 함께 내보낼 경우, 현업에서 바로 활동할 수준이 된다. 단기적 수급 불균형을 해결하려면 특히 박사 과정에 집중하는 것이 효과적이라고 본다.


Q: 데이터 분석가라는 직업에 만족하는가.

내 스스로 적성에 맞아 데이터 분석과 컨설팅을 하지만, 이 분야는 정말 하드워크를 해야 한다. 주말도, 밤낮도 없을 때가 많다. 직업 때문에 매일 운동하는 사람을 생각해 보라. 정말 축구가 즐거운 프로 선수이더라도 축구가 지겨워 질 때가 있을 것이다. 컨설턴트, 개발자, 데이터 분석가 모두 현재로서는 만만한 직업이 아니다.


Q: 수익은 어느 정도인가.

현재로선 데이터 분석을 하여 큰 돈을 벌 생각이라면, 국내 시장보다는 해외 시장을 노크할 필요가 있다. 적어도 한동안은 공급과 수요의 균형이 이뤄지기 어려운 시장이라고 본다.


Q: 국내에서는 어느 분야에서 데이터 분석 요구가 가장 많은가.

CRM 쪽에서 분석 시도가 많다. 업종은 민간 B2C, 온라인, 특히 이동통신과 신용카드 업계에서 상대적으로 데이터 분석 니즈가 많다.


Q: 데이터 분석에 대해 관심이 올라가면서 그 전에 비해 달라진 점이라면.

눈으로 보이는 변화다. SNS에서 오가는 이슈들을 데이터 시각화를 거쳐 디자인하여 눈에 확 들어오는 예쁜 그림으로 보여주는 것이 쉽게 느낄 수 있는 변화가 아닐까 한다.


Q: 전문가가 아니더라도 데이터 분석을 알고 있으면, 유리할 거 같다.

회사 대표가 데이터 분석을 이해하고 있다면, 두말할 것 없이 유리하다. 야구를 알면, 자신의 업무에 적용할 일이 없더라도 삶이 즐거울 수 있듯이, 데이터 분석을 알면 자신의 업무를 훨씬 유연하게 풀어나갈 수 있다. 분명한 것은, 데이터 분석 분야는 치열하다는 점이다. 추신수 선수처럼 치열한 데이터 분석 전문가들이 주목을 받을 수 있다. 아마추어 야구 선수들은 스스로 야구를 즐기지만, 외야에서 홈 플레이트까지 공을 바로 던질 수 있는 사람은 드물다. 데이터 분석 분야에서 전문가로 통하려면, 프로야구 선수가 홈 플레이트까지 바로 공을 던지는 것만큼의 분석 역량이 있어야 하지 않을까?


Q: 자신이 데이터 분석가로서 적성에 맞는지를 알아보는 방법이 있나.

한국데이터베이스진흥원의 빅데이터 아카데미 같은 데이터 분석가 양성 기관에 등록해 교육을 받아 볼 필요가 있다. 이 가운데 분석 전문가 과정은 분석 도구 사용법을 배워서 실제로 분석을 해보는 교육을 한다. 그 과정이 매우 흥미롭다면, 적성에 맞다고 볼 수 있다.


Q: 데이터 분석에 적합한 유형이 있나.

숫자에 예민하고 분석적 사고, 뭐든 파고 들어가는 성격이라면 더 좋다. 분석에 대한 흥미와 인내심이 필요하다. 결과가 바로 나오지 않더라도 며칠씩 머리 싸매고 포기하지 않는 근성도 필요하다. 일반적으로 과학자는 몇 년이 걸리더라도 포기하지 않고 도전하는 사람들이다. 프로의 세계에 들어가면, 개인적인 관심도를 넘어 팀에 기여할 수 있어야 한다. 더불어 요즘 강조되는 소통력도 필요하다. 대학교수도 연구비를 획득할 때 자신의 능력을 입증해야 하듯이, 기회를 얻으려면 그만한 소통력도 필요하다.


Q: 국내에는 DS라고 할 만한 데이터 분석가가 몇 명 정도 활동하고 있다고 보는가.

100명도 안될 것이라고 본다. 데이터 사이언티스트에 근접한 사람이 1500명 내외라고 봤을 때의 기준이다. 현재의 10배인 1500명의 DS가 있다면, 한국에서는 충분하지 않을까 한다. 한국만 놓고 보면, 그리 넓은 시장은 아니다.


Q: DS는 어떻게 양성돼야 한다고 생각하는가.

정규 교육과 더불어 실제 프로젝트 경험이 무척 중요하다. 1년에 1~2회 짧은 분석 프로젝트에 참여하는 것만으로는 당장 현장에 투입돼 결과를 도출해야 하는 프로로 활동하기는 쉽지 않다.


Q: DS가 되기 위한 추천할 만한 방법이 있다면.

학생인 경우가 학생이 아닌 경우로 양분해 소개한다. 개발자 등 현직 전문가가 데이터 사이언티스트로 넘어올 수 있다. 하지만 축구를 하다가 야구로 넘어오는 경우와 비슷하지 않을까 한다. 전문가가 되기 위해 필요한 교육 시간과 비용도 생각해야 한다. 반면, 학생이 데이터 분야로 진출하는 건 나쁠 게 없다. 한 국제 통계 자료를 보면, 비즈니스 인텔리전스(BI) 업무와 달리 현직 데이터 사이언티스트의 40% 이상이 석사이상 학위 소지자로 조사됐다. 40% 가운데 9%는 박사 학위를 갖고 있었다. 특정 과학 분야에서 박사들이 연구를 주도하듯이, 데이터 분석 분야도 박사들이 이끌어 가고 있다는 말이다. 물론 연구소에서는 학사와 석사도 있다. DS가 되려면 DS로 바로 가는 것이 아니라, 통계학이나 산업공학, 물리학, 심리학을 공부하면서 데이터 분석을 해 보는 것도 좋다. 미국에서는 대학에서 데이터 사이언티스를 양성하는 정규 석사과정이 빠른 속도로 늘어나고 있다고 들었다.


Q: DS로 진출하기 위해 준비중인 엔지니어에게 조언한다면.

정규 교육과정을 거치라고 조언한다. 학부 졸업 후 바로 현장 실무경험만을 쌓아 DS로 활동한다는 것은 현실적이지 않다. 학교 교육은 전문가들이 미리 만들어 놓은 것을 배우는 것에 집중한다. DS 분야에서 소위 스타들은 90%가 박사들이다. 나머지 10%도 석사다. 다시 말하지만 통계학 학부를 나와서 DS를 하겠다는 것은 난센스다. 구글에서 DS 검색 관련 1위는 UC버클리의 데이터 사이언스 과정이었다고 한다.


Q: 오픈소스 소프트웨어는 데이터 분석에서 어떤 의미를 갖나.

데이터 분석의 대중화에 기여한 측면을 들 수 있다. 과거의 비싼 상용 분석 패키지가 분석을 해보려는 사람들의 장벽으로 작용했다. OSS(Open Source Software)가 등장하면서 분석을 접해 보고나서 상??용자가 직접 개조의 여지를 많이 두므로 자신의 용도에 맞게 기능을 추가하거나 고쳐서 쓸 수 있다. 그만큼 분석 환경은 좋아진 셈이다. 이에 따라 개발 경험을 가진 사람이나 프로그래밍을 아는 사람은 상대적으로 유리하다. 결국 OSS가 개발과 분석의 경계를 무너뜨렸다고 볼 수 있다.


Q: 빅데이터가 DB 업계에 던진 이슈는 무엇인가.

지금까지는 기술 공급자가 시장을 주도했다. IBM이나 오라클은 소프트웨어를 갖고 있지만, 데이터가 없으므로 빅데이터 분야에서는 예전만큼의 설득력을 가질 수 없을 것이다. 반면, 구글이나 아마존 같은 업체들은 스스로 소프트웨어를 만들면서 데이터까지 있으므로 더 설득력을 갖게 됐다.


Q: BI와 빅데이터 분석이 다른 점이라면.

비즈니스 인텔리전스(BI)는 분석을 모르는 현업 실무자가 사용할 분석 도구를 만드는 일이었다. BI에서는 의사 결정을 하는 것을 목적으로 데이터 분석을 하지 않았다. 잘못된 의사결정을 피할 수 있도록 지원하는 것이 목적이었다. 따라서 업무 담당자가 원하는 분석을 할 수 있도록 자동화해야 했다.

<끝>