데이터 인터뷰

DB 노하우, 데이터직무, 다양한 인터뷰를 만나보세요.

데이터 사이언티스트 멘토가 통계학과 대학생 멘티에게 1회 - 베가스 대표 분석 컨설턴트 이윤모 박사

DATA 인터뷰
작성자
dataonair
작성일
2015-11-02 00:00
조회
7784




데이터 사이언티스트 멘토가 통계학과 대학생 멘티에게 1회

“마음 닿는 곳에 길이 있다”회

데이터 사이언티스트를 꿈꾸는 고려대 통계학과 3학년 이준기 군. 이 군이 베가스 대표 분석 컨설턴트인 이윤모 박사를 만나 데이터 사이언티스트의 세계에 대해 여러 이야기를 나눴다.

in_151102_01.jpg

멘토 이윤모(데이터 사이언티스트, 베가스 대표 컨설턴트, 통계학 박사)
멘티 이준기(고려대 통계학과 3학년, 대학연합 빅데이터 동아리 ‘보아즈’ 회원)

Click!! ▶ [이윤모 박사 인터뷰] 통계 분석가로 가는 길 “이론/경험/관심의 조화”

Click!! ▶ 데이터 사이언티스트 멘토가 통계학과 대학생 멘티에게 2회

안녕하세요. 고려대 통계학과 10학번 이준기입니다. 제 꿈이 데이터 사이언티스트여서 현업에서 활동하는 전문가를 뵙고 싶었습니다.

빅데이터 인기와 함께 얼떨결에 데이터 사이언티스트가 되었네요(^^). 저는 데이터를 분석하는 사람입니다. 빅데이터가 떠오르면서 주변에서 ‘데이터 사이언티스트’라고 해서 (회사) 내부적으로도 그렇게 부르고 있습니다.

베가스에 대해 소개해 주세요.

대규모 제조업체의 생산/설비 시설에서 나오는 데이터 분석을 발판으로 성장해온 분석 전문 업체입니다. 고객 중에는 굴지의 디스플레이사와 철강회사 등이 있는데요, 이런 회사들은 이미 오래 전부터 대용량 데이터를 분석해 오고 있었습니다. 자동화한 공장에서, 설비를 얼마나 안정적으로 유지할 수 있느냐의 관점에서 설비에서 보내오는 데이터를 모니터링하고 있습니다. 품질관리, 재고관리 등의 목적으로도 분석을 해왔습니다.

제품의 품질을 일정 수준 이상으로 확보하려면, 불량률 관리를 해야 합니다. 어떤 단위로 관리할 것인지, 어떤 요소를 기준으로 검사/분석해야 하는지 등을 결정하고, 분석 결과를 토대로 조업 조건을 바꿀 것인지에 대해서도 조언을 하게 됩니다.

우리나라 제조업은 고부가가치 상품을 만들어야 하는 입장에 처해있습니다. 그렇게 하려면 품질을 최상의 상태로 유지해야 하는데, 이것은 품질 ‘관리’가 아닌 품질 ‘분석’을 해야 가능해 집니다. 저렴한 인건비를 앞세우는 경쟁사나 최고의 품질과 기술을 보유한 경쟁사들과 겨루려면, 한 개를 만들더라도 불량이 없는 제품을 만들어야 경쟁력이 생기겠지요. 수요 분석과 적정 재고관리분석도 해야 하고요.

이런 과정을 여러 해에 걸쳐서 해나가고 있고 데이터 분석의 효과가 가시화되어 나타나고 있습니다. 함께 일한 지 이제 5년이 된 고객, 3년이 된 고객 등 다양한 이력들을 만들어 나가고 있는데 처음 시작할 때에 비추어 점점 새로운 영역으로 분석 주제를 넓혀 나가고 있습니다.

매우 다양한 분석 프로젝트를 수행하였던데요.

빅데이터라는 키워드가 시장에서 입에 오르내리기 이전부터 통계분석을 주로 하던 사람들이 모여서 만든 회사이기 때문입니다. 신입 직원들은 데이터 분석 업무를 주로 하고 있지만, 저처럼 비교적 일찍 데이터 분석에 뛰어든 사람은 CRM(Customer Relationship Management) 업무부터 했습니다. 시간이 지나면서 그 영역이 점점 확대되어 지금은 제조 현장에서 금융업까지 다양한 데이터를 분석하고 있습니다. 베가스는 제조 분야에서 기틀을 마련하여 여기까지 온 회사라고 볼 수 있어요.

박사님은 어떻게 하여 데이터 사이언티스트가 될 수 있었나요?

데이터 사이언티스트라는 직업이 최근에 부각되기 시작한 것처럼, 처음부터 데이터 사이언티스트를 목표로 하여 여기까지 왔다고 할 수는 없어요. 제가 좋아하는 것을 찾아오다 보니까 데이터 사이언티스트가 하는 일을 하게 됐습니다(^^).

데이터 사이언티스트에게 요청되는 자질이 너무 많은 거 같아요.

제가 봐도, 일반적으로 소개되고 있는 데이터 사이언티스트의 로드맵을 보면 초인적이더군요. 분석 실력은 기본이고 프로그래밍 실력에 통계 지식, IT 이해, 인문학적 소양까지 갖춰야 하니 언제 거기까지 갈 수 있을까 하는 생각을 해보았어요(^^).

요즘 현장에서 이뤄지는 실제 분석 프로젝트는 특정 데이터 사이언티스트(DS) 한두 명이 하는 것이 아니라, 팀 프로젝트로 이뤄집니다. 그러다 보니 데이터 사이언티스트의 개인 역량도 중요하지만, 팀 역량으로 과제를 해결할 수 있다는 말이 됩니다.

빅데이터는 크게 ‘기술’과 ‘분석’으로 양분됩니다. ‘빅데이터 기술 전문가’는 도입하는 곳의 상황에 맞게 분석 인프라를 구성할 수 있는 스킬이 요구됩니다. ‘빅데이터 분석 전문가’는 풍부한 경험과 분석 스킬을 갖춰서 기술 전문가들이 구축해 놓은 인프라에서 실제로 데이터를 분석하고, 필요에 따라 데이터 시각화까지 하는 사람이라고 볼 수 있습니다.

주변에서 데이터 사이언티스트가 되려면 석사 이상의 학력이 필요하다고들 합니다.

의사들이 학교 오래 다녔다고 수술 잘하고 진단 잘 내린다고 할 수 없듯이, 대학원을 나왔다고 무조건 분석을 잘한다고 볼 수는 없어요. 다만 대학원에서는 이론 깊이와 더불어 학부 과정과 달리 실제 데이터를 많이 접하게 됩니다. 그런 경험이 쌓이다 보니, 상대적으로 덜 두려워하는 경향은 있습니다.

하지만 ‘내가 박사인데~’하는 생각으로 들어온다면, 한 달 정도 지나면 자신 스스로의 부족함을 인정할 수밖에 없습니다. 속된 말로 “아, 나… 개털이구나!” 하고 자신을 깨닫게 됩니다(^^). 그것도 그럴 것이 대학원에서는 어느 정도 정돈된 데이터를 보면서 연구하므로 분석을 잘하지만, 현장의 데이터는 대학원에서 접했던 데이터와 분명히 다릅니다. 자신이 데이터를 정리할 수 있어야 합니다. 어찌됐거나 저희 회사 기준으로는 석사 과정은 마쳐야 한다고 생각하고 있는 것이 사실입니다. 물론 저희 직원들 중에는 학부만 졸업하고도 훌륭한 역량을 발휘하는 사람이 많이 있습니다.

in_151102_02.jpg

학부 졸업 후 5년 정도 현장에서 일하면서 내가 어느 영역을 좋아하는지 알고서 석사 과정에서 그것을 연구하고 싶습니다.

이쯤에서 제 경험 하나를 얘기해 드릴게요. 저는 석사를 마치고 군대에 다녀와서 한 대기업 계열 의 기술연구소에서 들어갔습니다. 이 연구소에서는 공기업에 공급할 계측 시스템을 미국에서 수입/공급하는 것을 준비하고 있었습니다. 그리고 저는 그 일을 담당하기 위해 필요한 자원으로 입사가 되었습니다. 건축공학, 토목공학, 기계공학 전공자 출신이 대부분인 그곳에 통계학 전공자로서는 제가 최초로 들어간 겁니다. 그런데 중간에 그 프로젝트가 무산돼 버렸어요. 제가 해야 할 일이 갑자기 사라져 버린 거죠.

제가 할 일이 무엇이냐고 여쭙기 위해 연구소장을 찾아갔는데 역으로 “왜 입사했어?” 하시더군요. 그러면서 성경책을 주시면서 “함께 기도하자”고 하시는 거에요. 당시 저는 계측장비팀에서 일을 했어요. 쉽게 말하여 수도 밸브 같은 계측 장비를 연구하는 팀이었죠. 그때가 94년 전후??든 플로피 디스크 5장짜리 MS-DOS에서 돌아가던 소프트웨어였습니다. 당시 제 월급이 70만원이 안 됐던 때였는데, 500만원 넘게 주고 구입했던 소프트웨어였지요. 데이터를 넣고 뭘 해봐도 원하는 대로 결과가 안 나오는 겁니다. 매뉴얼도 엄청나게 두껍고 사용법도 쉽지 않더군요.

in_151102_03.jpg

당시 직장 동료들은 PC에서 ‘Lotus 1-2-3’라는 스프레드시트를 사용하던데, 그것은 그들보다 잘 하기 어렵겠다는 생각이 들더군요. 그래서 마이크로소프트에서 내놓은 ‘엑셀’을 배워서 500만원 넘게 주고 구입했던 소프트웨어의 기능을 구현해보고 싶더라고요. 엑셀은 제가 더 잘할 수 있겠다는 생각을 했나 봅니다(^^).

엑셀을 써보니까 쉽고 재미있더군요. 그때까지 SAS 분석 소프트웨어만 사용해봤는데 훨씬 직관적이고 VB Script로 간단한 프로그래밍까지 가능하여 뭔가 한번 만들어 보고 싶었어요. 500만원짜리 그 수입 소프트웨어의 내부 구조를 이해하는 차원에서 MS 엑셀에서 데이터가 어떻게 움직이는지를 한 번 구현해 보고 싶더군요.

그렇게 하려고 했더니 데이터베이스도 알아야 하고, 프로그래밍 언어도 알아야겠더라고요. 제대로 한번 해보고 싶어서 회사에 IT 교육과정을 듣게 해달라고 요청했어요. 6개월에 걸쳐 프로그래밍 언어들, 네트워크, 오라클 데이터베이스 등 IT 교육을 집중적으로 받았습니다. 그때만 해도 지금과 같지 않아서였는지, 자신의 업무를 찾지 못해 불만 많았던 직원의 요청을 회사에서 잘 받아주더군요(^^).

네트워크를 공부하고 프로그래밍까지 공부하여 네트워크로 데이터를 주고 받는 소프트웨어를 직접 개발해 보니까 신기하고 너무 재미있는 거에요. 이렇게 해서 그 연구소에서 프로그래머 생활을 2년 정도 했습니다. 프로그래밍도 알고 오라클 DB도 알게 되자 ‘내 길은 다른 곳에 있겠구나’ 하는 생각이 들기 시작했습니다.

그 길이 바로 데이터였어요. 제 업무를 찾지 못해 방황하던 저를 옆에서 지켜보던, 지금도 가끔씩 연락을 드리는 이사님이 연구소장으로 취임했을 때였어요. 찾아가서 회사를 그만 두겠다고 했더니 “알았다”고 “나가”라고 하더군요. 사람 마음이라는 게...

“왜 안 잡느냐?”고 서운한 표시를 냈더니 “입사했을 때부터 언제 떠나나?” 하고 지켜봐 왔다는 거에요. 그 연구소장님이 이사였을 때, 신입사원이었던 제가 그 분과 비교적 자주 얘기할 기회가 있었거든요. 고3 수험생 자녀를 이유로 집에 늦게 들어가곤 했던 그 이사님과 술자리를 함께하곤 했는데, 그때 제가 술김에 이러저러한 불만을 많이 털어놨었나 봅니다(^^). “대학원에 가서 더 공부하겠다”고 했더니 그러라고 하셨던 겁니다.

모교 교수님을 찾아갔더니 “왜 왔냐?”고 묻더군요. “데이터를 다루는 게 매력적이라는 것도 있고 제가 아는 게 너무 없는 것 같아서 다시 공부를 하고 싶어서 찾아왔습니다”고 했지요. 그랬더니 “정식으로 입학 시험을 치러서 들어오라”고 하시더군요. 그 무렵에 IT 분야의 화두로 데이터 마이닝이 막 떠오르고 있었어요. 그것으로 박사 논문을 쓰고 싶다고 했더니 지도 교수님께서 선행연구도 별로 없다고 말리시더군요. 그래도 논문을 못쓰면 수료라도 하겠다는 마음으로 연구를 시작 했습니다.

남들이 안 한 것을 해보고 싶어하는 습성이 대학원에서까지 나온 겁니다. ‘남들이 가지 않았던 길을 걷는 게 어떤 면에서 좋을까?’ 하고 늘 생각했던 것이죠. 제자가 우겨서인지 지도 교수님께서 “데이터 마이닝과 관련된 책을 구입해 함께 스터디를 하자”고 하시더군요. 존경하는 그 은사님과 함께 당시 미국에서 데이터 마이닝을 전공하던 선배로부터 자료를 받아서 공부를 했어요. 결국 데이터 마이닝으로 논문을 써서 박사 학위를 받았어요(^^). 학위 논문을 마칠 즘에 CRM이 이슈가 되더군요.

신용카드사, 홈쇼핑, 이동통신사 등을 대상으로 짧은 분석 프로젝트들을 해보았습니다. 당시 이런 회사들에서는 분석이 회사를 바꿀 거라고 생각하지 않았어요.

분석 과제 제안을 했을 때, 관심 없어 하면 제 자신이 마치 번들 상품처럼 여겨지기도 했고요.
“전문 영역으로 갈 걸… 이렇게 자리를 못 잡고 떠돌아 다니는 사람이 되었을까?” 하는 자괴감까지 들었고요(^^).
DB 지식이 힘이 되어 줌을 실감했던 순간이었습니다.

하지만 얼마 지나지 않아 이 분야의 상황을 알게 되면서 제 생각이 너무 좁았음을 알게 됐어요. 금융, 제조, 유통 등 분야를 막론하고 분석할 데이터 자체가 준비 안 돼 있었던 거에요. 그 순간 ‘이 고객도 예전에 나처럼 답답하겠구나!’ 하는 생각이 들어 그때의 제 심정으로 얘기를 풀어나갔더니 공감대가 이뤄지며 대화가 되기 시작하더군요.

그때부터 “이 사람은 뭔가를 알아 듣는군!” 하는 평가가 나오기 시작했고요. ‘데이터가 충실하지 않을 때 어떻게 분석해야 하나?’ 하고 고민하던 고객의 답답함에 공감하면서 문제가 풀려나가기 시작했던 것이죠. 연구소에서 좌충우돌하며 공부했던 네트워크 지식과 프로그래밍 경험,

출처 : 한국데이터베이스진흥원

제공 : 데이터 전문가 지식포털 DBguide.net