데이터 인사이트

데이터 지식공유
나만 알기는 아까운 데이터 지식 함께나눠요.

호갱노노의 발전적 데이터 서비스 모델 도출

작성자
관리자
작성일
2020-09-10 09:42
조회
73


'2부. 호갱노노의 발전적 데이터 서비스 모델 도출

 

201611081478568034099_767f323a-ad30-4bd6-b1f5-8496822fc9ad.bmp

 

호갱노노 부동산 정보는 현재 무료로 서비스되고 있어서 수익 모델을 찾아야 하는 입장이다. 1차 만남 이후(첫 줄 링크 참고) , 호갱노노팀으로부터 KODB 데이터 스토어팀으로 연락이 왔다. 데이터 분석을 통해 아파트 가격을 예측한 블로그 운영자를 만나고 싶다는 요지였다.

수소문한 결과, 블로그 운영자는 SK텔레콤에서 데이터 분석가로 일하고 있는 전희원 씨로 확인됐다. 데이터 스토어팀의 주선으로 전희원 데이터 분석가와 호갱노노팀의 심상민 대표, 김준기 과장이 대면 인터뷰를 하는 자리가 마련됐다.

호갱노노 개발팀은 부동산 정보 서비스 모델 개발자 입장에서, 전희원 데이터 분석가는 데이터 분석 관점에서 향후 서비스 모델에 대한 의견을 주고 받았다. 인터뷰 결과 “계속 쌓이게 될 부동산 실거래가 데이터와 주변 교육시설 데이터 등 관련 데이터를 결합해 서비스를 발전시키는 한편, 데이터 분석을 통한 여러 부가 서비스를 제시하는 것에서 발전의 실마리를 찾을 수 있다”는 결론에 이르렀다.

 

1. 발전 모델도출 결과 요약

 

● 자문 담당: 전희원 데이터 분석가(SK텔레콤)

● 참석자: 심상민 호갱노노 대표, 김준기 호갱노노 과장(CTO)

● 일시: 2016년 7월 13일

● 장소: 경기도 수원시 광교의 호갱노노 사무실

● 접근방법: KODB 데이터 스토어 팀에서 사전 인터뷰어의 사회로 자문자와 자문 요청자들 간 대담

● 주요 자문결과 도출 및 시사점

·  데이터 전처리 과정은 전문 데이터   분석가들에게도 매우 많은 노력과 시간이 들어가므로 가치를 충분히 인정 받아야 함. 그 가치는 전처리   과정을 거친 데이터로 분석한 결과물로서 증명 가능

·  수익 모델을 찾아가고 있는 상황인데 서비스 개발자들도 계속해서 확보하고 있는 데이터를 분석한 결과물에서 찾고자 함. 지속적으로 가입 사용자들이 늘어나면, 가입 사용자들이 제공한   데이터를 통하여 차별화한 분석 데이터 제시 가능


다음은 호갱노노 개발팀과 전희원 데이터 분석가 간 대면 인터뷰 내용이다.

201611081478568123205_19837d08-007e-4030-ab6a-74dc73c7ed39.bmp



사회자: 세 분 모두 인터넷 포탈에서 근무했다는 공통점을 갖고 있네요. 그래서 서로 말이 잘 통하지 않을까 합니다.

심상민(이하 ‘심’으로 통일): 그러고 보니 서로 공통점을 갖고 있네요. 아파트 매매가격 데이터를 근거로 예측·분석한 전희원 매니저님의 글을 관심 있게 보았습니다. 분석 계기가 궁금합니다.

전희원(이하 ‘전’으로 통일): 평범한 직장인이 집을 마련하는 일은 매우 큰 ‘지름(투자)’ 가운데 하나입니다. 아직 집을 갖고 있지 않은 데이터 분석가인 제가 할 수 있는 일이 아닐까 해서 (분석을) 했습니다. 만약 제가 집을 산다고 했을 때 어느 정도를 지불해야 적절한지를 데이터로 도출해 보고 싶어서요. 실제로 분석해 본 결과 아파트 값은 평수와 층수 등이 가격을 너무나 정확하게 설명하고 있음에 놀랐습니다. 저는 부동산 데이터만큼 가격모형 설명을 잘 하는 데이터를 교과서 밖에서는 본 적이 없습니다. 그때 경험으로 짧은 기간의 아파트 값 변동 예측은 충분히 가능하겠다는 생각을 했습니다.

김준기(이하 ‘김’으로 통일): 예, 부동산 데이터가 매우 정석적인 데이터라고 생각합니다.

사회자: 호갱노노도 데이터 기반의 서비스이므로 분석 서비스들이 추가돼야 하는 거 아닌지 싶습니다.

: 해외에서는 이미 그런 서비스들이 각광받고 있습니다. 자사 서비스 이름을 딴 주택가격 지수를 토대로 향후 주택가격을 예측해주는 서비스가 있어요. 반면 국내 부동산 정보 서비스는 주로 호가 중심의 가격정보에 치중돼 있다고 봤습니다.

: 호갱노노 모델은 호가 중심의 기존 부동산 정보와 차별화할 수 있겠다는 생각으로 시작한 서비스입니다. 사실 인터넷에 아파트 값을 파악할 수 있는 데이터는 널려 있는데도 인터넷 쇼핑몰에서 모자 한 개를 살 때보다 더 못한 데이터를 근거로 거래하는 게 불합리하다고 본 거죠. 개발자이므로 이런 불편을 쉽게 해결할 수 있지 않을까 해서 부동산 정보 서비스 분야에 진출했습니다.

: 저는 야후코리아에서 개발자로 일하다가 데이터 분석이라는 세상이 있음을 알고 개발자의 길에서 분석가의 길로 갈아탄 경우입니다. 야후 본사 개발팀과 얘기를 나누는 과정에서 각종 통계 용어가 자주 등장하여 통계학과 학부에 편입하여 공부를 했고요. 호갱노노 팀은 언제 창업했나요?

: 창업한 지는 1년 정도 되었고, 호갱노노 서비스 모델을 만든 지는 7개월 정도 됐습니다. 앱을 내놓은 지는 4개월 정도 됐고요. 아파트 가격 분석을 해본 사람으로서 호갱노노의 데이터에 관심이 가지 않나요?

: 흥미롭고 탐나죠~ 매번 웹 사이트 구조가 바뀌면서 데이터 크롤링이 쉽지 않습니다. 그래서 분석을 해 보고 싶었는데도 할 수가 없었습니다. 데이터 분석가들 앞에서 공개적으로 발언할 기회가 주어지면 (데이터를) 긁어서 서로 공유하자고 강조하곤 했지요.

: 저희가 (데이터를) 통으로 드리기는 어려워도 원하는 지역이나 아파트 단지 중심으로 샘플 데이터를 제공할 수 있을 거 같습니다.

: 내부적으로 ‘부동산 담당 기자나 투자 분석가 등 데이터 기반으로 리포트를 써야 하는 사람 대상의 분석 서비스를 제공해 보면 어떨까?’ 하는 의견이 나온 적이 있었습니다. 외국에서는 특정 부동산 정보 서비스 업체가 자사의 지표를 기자들에게 제공하고 있어서 국내에서도 해보면 괜찮겠다고 생각한 거지요. 이에 대해 내부적으로 의견을 나눈 결과, 더 급한 서비스부터 준비하자는 결론이 나와 일단 유보해 두기는 했습니다만.

: 어렵게 전처리한 데이터인데 (그냥 두기에) 아깝지 않나요?

“전체 데이터 분석 과정에서 데이터 전처리는 80% 이상의 시간과 노력을 차지합니다. 그럼에도 대부분의 사람들은 전처리한 데이터를 보고 ‘공개된 데이터를 모아 놓았네!’ 합니다.”

: 저희는 데이터 분석가들에게 데이터 전처리 업무가 힘든 일일 거라고는 생각해 보지 못했습니다. 대부분 프로그래밍을 할 수 있는 사람들이므로 (데이터 전처리를) 쉽게 할 거라고 생각했어요. 회사에서는 보통 데이터를 제시하며 분석하라고 하지, 직접 긁어 모아 분석하라고 하지 않잖아요. 그래서 분석만 했지 수집할 기회는 별로 많지 않을 거라는 생각은 해보기는 했습니다만. 데이터 수집 방법을 알고 있어도 귀찮다 보니 데이터 크롤링을 하지 않은 거 아닌가요?

: 예, 맞습니다. 금방 좋은 힌트도 얻었잖아요(웃음). 저는 웹 페이지를 직접 보고 크롤링합니다. 이걸 파싱하여 분석할 수 있는 데이터로 만드는 데 시간을 투자하기가 매우 부담스럽거든요. 데이터 분석가들에게 한 이동통신사의 전화통화 내역 데이터가 주어졌다고 해보죠. 어떤 사람이 어느 누군가에게 몇 번에 걸쳐 전화를 했는지를 알아보려면 분석이 쉽도록 쿼리 처리해야 합니다. 그 과정이 전체 데이터 분석 업무의 70~80%를 차지합니다. 이 작업이 끝나면 데이터 모델링도 하고 시각화도 하는 등 실제 분석을 하게 됩니다. 이때부터는 일이 아니라 앞서 고생하여 정제한 데이터로 즐기는(?) 과정이라고 봅니다.

: 너무나 중요한 지적을 해주셨습니다. 대부분의 사람들은 (전처리한 데이터에 대해) 그렇게 보지 않은 거 같습니다. ‘공개된 데이터를 모아 놓았네!’ 하는 반응을 하면 망연자실해질 수밖에 없습니다.

: ‘아니, 어떻게 이걸 그렇게 볼 수 있느냐!’는 생각이 들지만 상대는 그 수고를 모르는 거 같더라고요.

: (호갱노노에서) 어떤 데이터를 갖고 있는지 모르니까 그렇게 반응하지 않을까요. 매매 및 전세 실거래가 데이터 말고도 다른 데이터도 많이 갖고 있지 않나요?

: 예. 호가 데이터 등 몇몇 관련 데이터를 지속적으로 모으고 있습니다. 이를 통하여 호가가 실거래가보다 높은 지역도 있고 낮은 지역도 있다는 것을 알게 됐습니다. 이것은 매우 중요한 지표 가운데 하나입니다. 왜 그렇게 나오는지를 분석해 보고 싶은데 아직 거기까지 가지 못했습니다. 특정 시점의 매매가와 호가의 차이, 매매 추이 등을 분석해 보면 매우 흥미로운 결과가 나올 거라고 생각합니다.

: 동의합니다. 그 결과가 뭔가와 연결될 거라는 생각이 들어요. 제가 보기에는 향후 호갱노노의 수익 모델은 분석 측면에서 고민해 보면 나오지 않을까 하는데요. 앞서 심 대표께서 말씀했듯이 사람들은 ‘그냥 가져온 데이터를 갖고 있는 게 아닌가?’ 하고 생각하기 쉽거든요. 하지만 그걸 분석하여 사회현상을 데이터로 설명할 수 있다면 사람들도 (정제한 데이터의) 가치를 인정할 거고 정말 재미있는 서비스가 되지 않을까 합니다.

: 기반이 되고 핵심이 되는 데이터는 부동산 실거래가입니다. 하지만 이 실거래가 데이터를 토대로 뽑을 수 있는 또 다른 데이터도 정말 많습니다. 보통 전세는 2년 만기로 계약을 하잖아요. 그러다 보니 2년 전의 전세 거래 데이터를 기반으로 향후 전세 물량을 예측할 수도 있어요.

: 신규 아파트는 입주 시점이 있는데 그때 전세 매물이 넘치는 현상이 나타납니다. 실제 전세가는 2년 후에 크게 한번 바뀝니다. 또한 아파트 값이 바뀌는 분기나 월이 있습니다. 중개 사무실에 전화하면 대부분 그런 정보를 알고 있습니다. 입주 시 대출금 만기일도 알고 있어서 그 시기가 오면 매물이 좀 나올 거라고 예측까지 해줍니다. 하지만 현재 부동산 정보 서비스에는 그러한 정보는 반영돼 있지 않습니다. 그래서 향후 추가할 서비스는 중개업소 담당자들의 머리에 든 정보를 끄집어 내서 공유할 수 있는 모델이면 좋겠다고 생각하고 있습니다.

: 현재 들이는 노력 대비 우선순위를 정해서 접근 중입니다. 아파트 가격정보가 가장 정형화된 데이터이므로 현재로선 아파트 위주의 서비스를 하고 있습니다.

김: 학교 평가지수도 마련해 놨어요. 초등학교는 교사당 학생 수, 중학교는 특목고 진학률 등을 순위를 매겨 그 학교와의 거리, 중학교 학군 배치 등 가격에 영향을 미치는 데이터는 모두 수집하고 있습니다.

: 메타 데이터 관리가 무척 어려울 거 같습니다.

: 현재로선 두 명의 개발자가 모든 걸 해야 하므로 자동화해 처리하고 있습니다.

사회자: 귀중한 시간을 내서 참여해 주신 것에 대해 감사 드립니다. (끝)

 

2. 데이터 분석 자문가의 의견

 

“향후 데이터 서비스의 방향을 잡으려면 데이터 분석가의 힘 필요”

 
201611081478568329594_9de78af5-9163-4b57-8e74-4df389776f9b.jpg

▲ 전희원 매니저 (SK텔레콤 데이터 분석부)




데이터 기반의 서비스  스타트업에서 데이터 활용을 어떻게 할지는 매우 중요한 사항입니다. 특별한 경우가 아니라면 스타트업에서 비싼(?) 데이터 과학자를 채용하기란 쉽지 않습니다. 매출과   바로 연결되는 결과물을 만들어 내는 개발자에 비해 데이터 사이언티스트는 투자 성격이 강한 직종이기 때문입니다.

하지만 데이터 사이언티스트가 있고 없고가 향후 서비스의 방향을 잡을 수 있느냐 없느냐로 직결될 수 있음을 이러 저런 스타트업들과의 만남을 통해 알 수 있었습니다. 예를 들어, 여러 데이터가 있고 이들을 잘 연결하면 사용자가  궁금해 할 만한 서비스를 구현해 낼 가능성은 올라갑니다. 하지만 데이터 사이언티스트가 없는 상황에서 여러 데이터를 연결해 가능성을 파악하고, 간단한 프로토타이핑을 만들어 테스트를 거쳐 가설을 검증하기란 쉽지 않을 것입니다.

이 과정이 없다면 사실상 서비스는 근거 없는 아이디어와 개발을 얼마나 빠르게 할 수 있는가의 싸움이 되는 것이어서 서비스는 항상 위태로운 상황에 남게 됩니다. 단순히 이 문제는 A/B 테스트 도구의 문제가 아니라, 서비스를 어떠한 관점으로 바라보고 발전시키고 있느냐의 질문과 동일한 문제를 지적하고 있기도 합니다. 무엇보다 이런 관점으로 서비스를 발전시키는 과정은 벤처캐피탈에게도 상당히 매력적으로 다가설 수 있다고 생각합니다. 데이터 분석 관점에서 자사의 서비스를 바라보려는 호갱노노 팀의 자세는 매우 현실적으로 비즈니스를 바라보는  모습으로 파악됩니다. (끝)