데이터이야기

DB 노하우, 데이터직무, 다양한 인터뷰를 만나보세요.

데이터 사이언티스트 커리어에 대한 고려 사항

데이터 이야기
작성자
dataonair
작성일
2015-01-15 00:00
조회
6375


고영혁의 데이터 인사이트와 서비스 디자인 #2

- 데이터 사이언티스트 커리어에 대한 고려 사항 -



1. 데이터를 업으로 한다는 것

데이터를 업으로 한다는 것에 대해 어떻게 생각하고 있으신가요

첫 번째 칼럼에서 이 연재 칼럼의 화두 범위를 인사이트, 데이터 시각화, 서비스 디자인을 위한 데이터 분석, 데이터 기반 비즈니스 개발로 잡았습니다만, 사람에 대한 주제를 추가하겠습니다. 스펄렁크(Splunk) 가 내세우는 무생물이 만들어내는 머신 데이터(machine data) 도 데이터의 큰 한 축이지만 사람이 직접적 간접적으로 만들어내는 데이터는 현재까지도 앞으로도 중요한 축일 수밖에 없으며, 사람을 제대로 이해하지 않고서는 의미 있는 데이터 분석을 할 수가 없으니까요.

데이터를 생산하고 소비하는 사람에 대한 고민도 중요하지만, 데이터를 업으로 하는 사람에 대해서도 지속적인 관심을 갖고 고민해볼 필요가 있습니다. 데이터와 관련된 커리어를 간단하게 정리해볼까요 데이터를 생산하는 일을 통해 이쪽 커리어와 간접적으로 연결되는 서버사이드 프로그래밍 중심의 엔지니어, 데이터를 쌓고 관리하는 일과 관련된 전통적인 DBA(Database Administrator), 데이터를 분석하는 Data Analyst 로 대표되는 다양한 세부 직업들, 그리고 업 이름에 데이터가 들어가지는 않지만 데이터 기반으로 마케팅을 하는 직군이라든가 데이터를 많이 다루는 연구원 등 데이터의 활용단으로 나누어볼 수 있습니다. 한편 빅데이터가 대두되면서 이것을 제대로 처리하기 위한 하둡(Hadoop) 솔루션 생태계가 생기고 이쪽에 대한 전문성을 갖는 하둡 엔지니어들도 생겨나고 있습니다.

이 글을 읽으시는 분들은 이 데이터 관련 업에 이미 종사하고 있거나 아니면 앞으로의 업으로 관심을 갖고 계실 것입니다. 어떤 커리어이든 마찬가지이지만, 데이터를 업으로 한다는 것은 뭔가 있어 보이고 앞으로 뜬다더라는 식의 이야기에 홀깃해서 선택하는 그런 의사결정이 되어서는 안됩니다. 업 자체의 전망도 중요하고, 그 업에서 어떤 일을 하게 되는 지도 알아야 하고, 그런 일을 잘 하려면 본인이 어떤 역량을 갖추어야 하는 지도 그에 따라 고민해야 합니다. 물론 해당 업에서 몇 년 정도 경력이 쌓였을 때 어느 수준의 연봉을 받는 지도 대단히 현실적으로 중요한 부분이지요.

이번 칼럼에서는 요즘 특히 화두가 되고 있는 데이터 사이언티스트(Data Scientist), 데이터 과학자(이왕 한글화하는 거면 자료 과학자가 맞으려나요)라는 데이터 업의 커리어 중 하나에 대해서 이런 관점으로 살펴보고자 합니다.


2. 데이터 사이언티스트 (Data Scientist)

데이터 사이언티스트는 과연 어떤 일을 하는 사람일까요

사실 데이터 사이언티스트는 무슨무슨 일을 하는 사람이다라고 명쾌하게 딱 떨어지게 설명되어 있는 것은 여전히 없습니다. 그리고 그런 형태의 정의가 적절한 지에 대해서도 많은 사람들의 의문을 갖고 있습니다. ‘데이터 사이언스를 하는 사람’이라고 논리적으로 퉁쳐서 표현할 수도 있겠지만 그럼 결국 아무 것도 해결된 것이 없이 ‘데이터 사이언스는 무슨 일인가’라는 질문에 책임이 넘겨지게 됩니다. 이런 정의의 모호함은 태생적으로 다양성이 극대화되어 있거나 역사가 짧은 경우에 많이 발생하는데 데이터 사이언스는 이 두 가지 특징을 모두 갖고 있다고 볼 수 있습니다.

이런 경우에 비교적 효과적인 해결책이 바로 집단지성을 이용해 전체적인 의미를 파악할 수 있는 위키피디아(Wikipedia)입니다. 위키피디아의 데이터 사이언스 설명을 보면 ‘데이터로부터 지식을 추출하는 것(the extraction of knowledge from data)’이라고 시작하면서 이 일에 필요한 여러 가지 관련 지식과 세부 작업들을 설명하고 있습니다. 그리고 데이터 사이언티스트는 아직 별도의 항목을 두어 설명하고 있지 않고, 데이터 사이언스 설명 안에서 ‘데이터 사이언스를 실행하는 사람’으로 정의하고 있습니다.

위키피디아의 설명에서 용어의 역사 부분을 보면 데이터 사이언스라는 말도 학계에서 시작은 되었지만 점점 업계에서 실질적으로 활용되는 흐름으로 이어진 것을 확인할 수 있습니다. 그러다가 2008년에 세계 최대의 전문가 네트웍 서비스인 링크드인(LinkedIn) 의 DJ Patil 과 역시 세계 최대의 소셜미디어 서비스이자 구글(Google)과 어깨를 나란히 하는 (Facebook)의 Jeff Hammerbacher 가 “우리가 바로 데이터 사이언티스트다”라고 선언을 합니다. 이후 이렇게 데이터가 잔뜩 쌓여 있는 현장에서 이들과 비슷한 일을 하는 사람들을 데이터 사이언티스트라고 부르며 이 직군 자체가 활성화되기 시작했다고 볼 수 있습니다.

그렇다면 이런 사람들이 어떤 일을 하는 지 구체적으로 살펴보는 것이 결국 데이터 사이언티스트가 무엇이냐에 대한 실질적인 답변이 될 것입니다. 간단하게 정리해볼까요

만… 어떤 이야기를 나누고 싶은가요 언제든지 의견 환영합니다. 그런 의견을 주시는 것이 종종 저자를 도와주는 일이라는 것을 팁으로 드리며, 첫 칼럼을 마칩니다. 모두 행복한 하루 되세요~


고영혁 (Dylan Ko)
Gonnector 대표 / 경희사이버대학교 모바일융합학과 겸임교수 (데이터 사이언스)이메일 Gonnector@gonnector.com
홈페이지 www.gonnector.com
페이스북 http://fb.com/Gonnector / 트위터- @Gonnector
프로필 http://linkedin.com/in/gonnector/ko



출처 : 한국데이터베이스진흥원

제공 : DB포탈사이트 DBguide.net