데이터 인터뷰

DB 노하우, 데이터직무, 다양한 인터뷰를 만나보세요.

“데이터 모델링, 정답 없지만 창작의 기쁨 있는 곳” - 김기창 데이터 모델러

DATA 인터뷰
작성자
dataonair
작성일
2017-07-31 00:00
조회
3476


데이터 모델러, 김기창

“데이터 모델링, 정답 없지만 창작의 기쁨 있는 곳”

- 모델링은 데이터의 여러 분야로 나아가는 관문
- 수학적 재능과 분석적 사고를 하면 유리
- 몰입하고 생각하면서 1만 시간을 투자하라!



in_041.jpg
▲ 김기창, 데이터 모델러(제공: 김기창)


“네가 자기의 일에 능숙한 사람을 보았느냐 이러한 사람은 왕 앞에 설 것이요 천한 자 앞에 서지 아니하리라.” [개역개정 성경], 잠언 22, 29 김기창 씨의 [관계형 데이터 모델링 가이드]의 앞 부분에 나오는 문구다. 국내를 대표하는 데이터 모델러 가운데 한 명인 김기창 씨가 DBGuide.net에 그동안 닦아온 경험과 이론을 토대로 [김기창의 데이터 모델링 이야기]를 연재한다. 연재에 앞서 여의도의 한 카페에서 그와 만나 데이터 모델링에 대한 이야기를 나눴다. 김기창 씨는 뉴질랜드에서 1년이라는 충전시간을 보내고 올 초에 돌아왔다. 수학적 마인드에 몰입과 고민의 1만 시간을 보내면 누구나 우수한 데이터 모델러로 태어날 수 있다고 ‘1만 시간의 법칙’을 강조한다. 누구나 자신만의 재능을 갖고 있다고 생각하는 김기창 씨는 자신의 데이터 모델링 경험과 재능을 세상 사람들과 나누고 싶다. 그 바람으로 2010년에 [관계형 데이터 모델링 가이드]에 이어 2014년에 [관계형 데이터 모데링 노트]를 내놓았다. 그가 책에서 다 못했던 얘기와 새로 터특한 이론을 ‘강의’ 형식으로 8월부터 몇 회에 걸쳐 DBGuide.net에 소개한다.


데이터 모델링 전문서를 내놓아 좋은 반응을 얻고 있는 것으로 알고 있다.

한국에는 뛰어난 데이터 모델러도 많고 스스로 뛰어나다고 자부하는 이들도 많다. 모델링을 놓고 논쟁이 자주 있어서 책을 내놓기가 망설여졌다. 하지만 모델링에 관하여 정리해 둔 게 있어서 책으로 내놓기에 이르렀다. 중간에 힘든 과정이 있어서 몇 번 포기할까 하다가 내놓았다. 책의 내용을 놓고 이의를 제기하는 경우는 거의 없었다. 오히려 평가가 좋아서 두 번째 책 [관계형 데이터 모델링 노트]까지 내놓을 수 있었다.


in_042.jpg


관계형 데이터 모델링 가이드의 앞 부분에 나온 성경의 잠언 구절이 눈길을 끌었다.

책을 내놓기 직전, 교회에서 설교를 듣던 중 ‘아, 그래!’하는 생각에서 이 문구를 책에 넣기로 했다. 독자들로부터 인상적인 문구라는 말을 여러 번 들었다. 나중에 알고 보니, 잠언 22장 29절은 내 휴대폰 뒤 네 자리 번호(2229)와 같더라.


두 권의 책 저자로서, 출간 이후 어떤 도움을 받았나.

다양한 경로로 확보한 이론을 내 것으로 받아들이는 기회가 되었다. 데이터 모델링 스킬도 그만큼 올라갔다. 그 전에는 아는 사람이나 회사 내부적으로 인정을 받았는데 책을 내면서 (데이터 모델러로서) 대외 인지도가 크게 올라간 것을 느낄 수 있었다. 모델링 분야에서 나를 알리는 좋은 기회가 되었다.


[모델링 가이드]를 낸 지는 6년이 넘었고, [모델링 노트]는 3년이 넘었다. 지금에 와서 달라진 것은 없나.

달라진 것보다 추가해야 할 지점이 보인다. [모델링 노트]에 이해를 더 쉽게 할 수 있도록 몇 절을 추가할 생각이다. [모델링 노트]가 [모델링 가이드]와 달라진 점은 여러 영역에서 집합 개념이 접목된 것이다.


전기공학을 전공한 것으로 알고 있는데 데이터 전문가가 된 배경이 궁금하다.

학부 때는 전공 공부에 별 흥미를 느끼지 못했다. 직장 생활을 소프트웨어 개발업체에서 시작했다. 마이크로소프트 ‘액세스(Access)’와 연동하여 프로그램을 짜는 일을 하게 됐는데 테이블 설계를 잘했고 주변에서도 좋은 평가를 받았다. 입사 후 2~3년은 개발 업무를 병행하면서 테이블 설계를 했는데 매우 재미 있었다. 2000년대 초반, 당시 대형 인터넷 쇼핑몰 개발 프로젝트가 많았다. 설계 업무가 늘어나면서 개발 업무가 자연스럽게 줄어들었다. 팀장 역할을 하면서부터는 업무 조절이 가능하여 설계만 했다. 설계에 자신감이 붙으면서 데이터 모델링 전문업체(오픈메이드컨설팅)로 이직했다. 지금으로부터 12년 전이다. 오픈메이드에 입사할 때, 튜너와 모델러 사이에서 어느 걸 선택할지를 고민했다. 모델러로 방향을 잡고 당시만 해도 소규모였던 그 회사에 들어갔다. 아이들이 한 살, 네 살 때라서 아내의 반대가 심했다. 하지만 모델링에 자신이 있었으므로 입사했고 튜닝을 겸하여 모델링을 하였다. 10년 정도 모델링 업무만 하다 보니 정체된 느낌이 들었고 변화를 주고 싶었다. 몸도 마음도 지쳐있던 때라서 쉬고 싶었다. 가족과 함게 뉴질랜드에 가서 1년을 보내고 올 초에 한국에 돌아왔다.


현재는 어디서 어떤 일을 하고 있나.

유명 데이터 컨설팅 업체 소속으로 국책 은행의 시스템 개발 프로젝트에 참여하고 있다. 여기서는 직접 모델링을 하지 않고 디렉터 역할을 한다. 개발자들이 모델링한 것을 검토하고 코칭하는 업무다. 개인적으로는 데이터 전문가 온라인 카페 회원으로 활동하면서 모델링 관련 강의도 종종 하고 있다.


프리랜서로 활동하는 건가.

그렇다. 특정 조직의 일원이 되는 건 현재로선 염두에 두지 않고 있다. 현장의 많은 사람과 만나는 일을 하고 싶다. 특정 업체에 소속되면 인간적 접촉이 줄어들므로 사람을 만나는 데서 변화를 찾고 싶다.


책에서 ‘1만 시간의 법칙’을 강조하고 있었다.

절대적인 시간 기준이 아닌, 몰입과 고민의 시간 기준으로 1만 시간을 말한다. 몰입하고 고민하면서 1만 시간을 노력하면 정말 모델링을 잘할 수 있다.


결국 모델링을 좋아해야 가능하다는 얘기가 아닌가.

좋아해야 힘이 나고 발전이 있으므로 당연하다.


‘모델링이 쉽다’고 소개하고 있었는데 모델링에서 좌절하는 경우도 적지 않다고 한다.

사람마다 소질이나 성향이 다르므로 이를 고려해야 하지 않을까 한다. 데이터 쪽에서 일하는 사람들은 대체로 분석적이고 차분한 성격이 많았다.


어떤 유형이 데이터 모델러에 적합한가.

일반론이 될 우려가 있어서 조심스럽다. 내가 봤을 때는 수학과 바둑에 어느 정도 소질을 갖고 있다면 데이터 모델링을 잘할 가능성이 있다.


실제로 수학을 잘하나.

학창시절에 수학 때문에 대학에 갔다고 할 정도로 잘했으나 아주 좋아하지는 않았다. 기본만 이해하면 파생되는 부분은 쉬웠다. 데이터 모델링도 비슷했다. 난 쉽다고 생각하는데, 이에 공감을 못 하는 사람도 분명 있을 것이다. 수학의 집합 개념과 데이터의 엔티티(Entity)의 개념이 매우 유사하다. 집합론을 창시한 게오르크 칸토어(Georg Cantor)는 집합에 대해 ‘우리의 직관 또는 사고의 대상으로서 확정되어 있고, 서로 명확히 구별되는 것들의 모임’이라고 정의했다. 엔티티도 집합처럼 기준이 명확해야 한다. 그만큼 수학이라는 언어에 익숙한 사람은 데이터 모델링을 하는 데 유리하다.


in_043.jpg


데이터 모델링을 강조하는 이유는 무엇인가.

게 두 가지로 나눠서 생각해 볼 수 있다. 먼저 엔터프라이즈 아키텍처(EA), 데이터 품질(DQ), 마스터 데이터 관리(MDM) 등 데이터의 여러 분야로 나아가는 관문이 데이터 모델링이라고 생각해서이다. 기업의 데이터를 가장 앞단에서 접하는 사람들이 모델러이고, 무에서 유를 창조하는 일이기도 하다. 두 번째로는 모델링은 애플리케이션의 중복 개발이나 난개발을 방지하는 차원에서 매우 중요하다. 시스템의 근간에 데이터가 있는데, 결점이 없는 데이터를 만드는 일이 모델러의 역할이다. 결점이 없는 데이터라야 데이터 웨어하우스나 데이터 마트, 빅데이터에서 사용하는 게 의미가 있다.


최근의 빅데이터 현상을 어떻게 보는가.

데이터라는 공통분모가 있지만, (빅데이터 분야에서는) 전통적인 DB 전문가와는 동떨어진 얘기를 하고 있었다. 물론 DB 전문가가 데이터 분석 전문가로 활동하는 경우도 있지만, 개인적으로는 데이터베이스 분야와 빅데이터 분야는 다르다고 본다. 데이터 모델링을 잘 몰라도 데이터 분석을 할 수 있지만, 데이터 분석가가 모델링에 바로 접근하기는 어렵다.


in_044.jpg


데이터 모델링 연재를 하겠다고 마음먹은 배경은.

정확한 정보를 널리 알리고 싶어서다. 시스템 개발 현장에서 모델링을 제대로 안 하고 넘어가는 경우가 적지 않다. 두 가지 이유가 있다. 먼저 비용이나 행정처리 등 여러 이유로 모델링을 의도적으로 생략한 채 개발하는 경우이다. 두 번째는 몰라서 모델링을 하지 않은 경우다. 모델링을 못하거나 안 하는 것에 대해 알릴 필요가 있다고 봤다. 물론 데이터 모델링을 거치지 않고 개발해도 시스템은 돌아간다. 하지만 모델링이 제대로 이뤄지지 않으면 개발도 어려워지고 비용도 더 들어가게 된다. 원활하게 돌아가지 않더라도 운영은 되기에 문제가 없는 거처럼 보이지만, 각종 에러에 대처하기 바쁜 시스템 환경이 될 가능성이 높다. 나중에 여러 명의 개발자를 동원해 유지보수를 해야 하므로 결국은 더 비용이 들어가고 만나.


DBGuide.net에 할 연재도 책처럼 체계적인 접근을 기대해도 되나.

비록 주제는 어렵더라도 쉽게 소개하려고 마음먹고 있다. 모델링에 대해 어느 정도 아는 독자에게 유용하도록 특정 주제를 놓고 데이터와 관련한 종합 지식을 동원해 소개하고 싶다. 일종의 온라인 강의라고 생각해도 좋겠다.


털어놔도 괜찮은 비밀이 있다면.

컴퓨터를 잘 못다룬다. 기계치에 가깝다. 어머니께서 ‘아들 직업이 컴퓨터를 다루는 일’이라고 소개한 때문인지 주변에서 ‘컴퓨터 좀 봐달라’고 할 때면 매우 난감하다. 컴퓨터에서 자료, 즉 데이터를 잘 관리하도록 돕는 일을 하지만 하드웨어는 잘 모른다(^^).


향후 계획이 있다면.

좋은 모델을 만드는 것을 최고의 가치로 여기는 모델러가 모여 있는 최고의 모델링 조직을 만드는 게 바람이다. 모델러가 기업에게 제공할 최고의 가치는 좋은 모델을 제공하는 것이다. 많은 기업에서 훌륭한 모델이 운영되기를 바라고 있으며, 그런 모델을 설계하는 끼 있는 모델러가 많아지도록 노력하고 있다. 그 바람을 이룩하는 차원에서 독립해 사업을 하고 싶은 마음이 제일 앞서지만, 상황이 여의치 않아 고민 중이다. 기술력만 있고 영업력과 자본력은 부족한 상황이다. 큰 조직에서 데이터를 관리하는 DA 역할이나 모델링 팀을 이끄는 팀장 역할도 고려하고 있다. 당분간은 프리랜서로서 사람들 만나면서 방향을 모색할 생각이다. (끝)


출처 : 한국데이터산업진흥원
제공 : 데이터 온에어 Dataonair.or.kr