전문가칼럼

DBMS, DB 구축 절차, 빅데이터 기술 칼럼, 사례연구 및 세미나 자료를 소개합니다.

데이터는 4차 산업혁명의 석유일까? - Hello AI 김영욱 대표

전문가칼럼
작성자
dataonair
작성일
2021-11-11 09:52
조회
113

데이터는 4차 산업혁명의 석유일까?


지금은 석유로 인해서 큰 부를 쌓은 중동 지역도 처음에는 석유가 물보다 가치 없는 존재였다. 심지어는 물을 얻기 위해서 땅을 파다가 석유가 나오면 저주받은 땅이라고까지 했을 정도니, 석유의 가치를 몰랐을 정도가 아니라 석유는 실망의 상징이었다. 하지만 증기 엔진이 주력이었던 산업혁명이 지나고 1859년에 에티엔 루누아르가 최초의 상업적인 내연기관을 만들어 내면서 석유의 중요성이 급증하게 되었다. 석유는 이전의 석탄을 연료로 사용하던 시기에 비해서 훨씬 에너지 밀도가 높았고 또 화력을 조절하거나 엔진의 출력을 유지하는 것도 효과적이었다.

군함들도 석탄을 연료로 하는 군함들과 석유를 연료로 하는 군함의 성능 차이는 엄청나서 결과적으로 모든 군함도 석유 시대로 빠르게 넘어왔다. 세계 2차 대전 당시에 마지막까지 석탄을 고집했던 일본도 부랴부랴 석유 기반으로 전환할 수밖에 없었으며 미국이 일본에 대해서 석유 금수 조치를 취하자 진주만을 습격해서 태평양 전쟁이 발발하는 계기도 결국 석유 때문이었다.


하지만 석유는 유정에서 뽑아낸 원유 그대로 사용하지는 않는다. 석유를 단계별로 잘 정제하고 각 특성을 잘 살릴 수 있는 성분별로 잘 분류해서 사용해야 한다. 일반적으로 석유는 정유사에 의해서 휘발유, 나프타, 제트유, 등유, 경유, 중유, 윤활유, 아스팔트, LPG, 부생연료유 등 여러 종류의 성분으로 분류하게 된다. 이렇게 분류되고 잘 정제되었을 때 석유는 제대로 된 가치를 가진다. 한국은 석유 자원을 100% 수입에 의존하고 있는 자원 수입국이지만 다른 면으로 보면 한국은 또 60여 개 국가에 석유를 수출하는 수출국이다. 즉 전 세계 국가 중에 대략 3분의 1 이상이 Made in Korea 석유를 사용하고 있는 것이다. 이것이 가능한 이유는 간단하다. 우리나라에서 정제한 석유의 품질이 높고 모든 국가가 원유를 잘 정제해서 사용할 수 있는 기술이 없거나 혹은 경제성이 맞지 않기 때문이다. 석유 이야기를 길게 시작하는 이유는 최근 다른 강연이나 기고문 등에서 ‘데이터는 21세기의 석유입니다.’라고 말씀하시는 분들을 어렵지 않게 발견 할 수 있어서이다. 하지만 석유가 그 자체로 가치가 없듯이 데이터도 잘 정체하고 사용 가능한 형태로 잘 가공했을 때 그 가치를 가질 수 있다.


그림1 석유의 정제 과정 (출처 금성출판사 티칭백과)
<그림1> 석유의 정제 과정 (출처 금성출판사 티칭백과)


어떻게 보면 데이터는 21세기 석유입니다!라고 이야기를 계속하는 것은 어느덧 무책임한 발언까지 될 수 있는 변화의 변곡점에 서 있게 되었다. 이제부터는 진짜 21세기 석유 활용법을 위해서 정제하고 가공해서 제대로 된 데이터를 만들어 내야 하는 시점이 되었다.


작게 시작해서 크게 끝나는 데이터 혁명.

‘데이터란 무엇인가?’부터 다시 시작할 필요는 없지만, 데이터의 활용이라는 측면에서 본다면 데이터란 현실 세계의 수치화라는 측면에서 접근할 필요가 있다. 우리가 현실에서 일어나는 일들을 눈으로 보고 듣고 느끼고 있지만, 그 본질을 이해하는 데에는 다분히 모호한 부분이 있다. 이런 모호한 부분을 우리는 일반적으로 ‘감’이라고 표현을 하는데 소위 말하는 ‘감’은 복제되거나 반복하기 어려운 부분들이 있다. 데이터는 이런 부분들을 수치화하고 최적화 할 수 있는 강력한 무기로 작동한다.


TK엘레베이터(구 티센크루프 엘레베이터)는 대표적인 엘리베이터 회사 중 하나이다. 엘리베이터 회사들이 가지고 있는 고민 중 하나는 점점 고층화되어가고 전자화되어가는 엘리베이터의 유지보수 문제이다. 이 문제를 해결하기 위해서 엘리베이터 데이터를 수치화하고 분석하는 것뿐만 아니라 모니터링하는 시스템을 오래전부터 운영하고 있었다. 이렇게 엘리베이터 운영 데이터를 수치화하고 분석하다 보니 고장이나 장애 상황을 이해할 수 있게 되었고 장애가 발생하기 전에 사전 조치하는 것이 가능해졌다. 일반적으로 이런 기술들을 예지 정비(Predictive Maintenance)라고 부른다. TK가 이런 예지 정비가 가능했던 이유는 엘리베이터에 설치된 센서들을 IoT 기술로 잘 묶었으며 여기에서 발생하는 데이터를 수집하고 분석해서 상황을 통제하는 부분에 클라우드 기술을 적극적으로 접목했다. 이 과정에서 Microsoft와의 협업도 함께 이루어졌다.


그림2 IT기반으로 정비 할 수 있는 기반을 갖춘 TK(구 티센크루프) (출처 Microsoft 제공 영상)
<그림2> IT기반으로 정비 할 수 있는 기반을 갖춘 TK(구 티센크루프) (출처 Microsoft 제공 영상)


스타벅스의 데이터 사랑은 업계에 유명하다. 그래서인지 각 지역의 면적을 스타벅스 매장의 개수로 나눈 소위 말하는 ‘스벅지수’라는 것이 존재한다. 즉, 각 지역에 스타벅스 매장의 개수가 많으면 많을수록 구매력이 높은 동네라는 것이다. 매장의 스타벅스 본사에서는 커피 한잔을 제공하기 위해서 IT의 힘을 적극적으로 활용하고 있다. 최근에는 IoT, 블록체인(Blockchain), AI 등의 기술들을 한꺼번에 도입하는 등 그 속도를 더하고 있다. 스타벅스에서 클라우드를 활용해 제일 먼저 도입한 기술은 바로 ‘블록체인’이다. 블록체인 하면 많은 사람이 비트코인을 쉽게 떠올리겠지만 블록체인의 본질은 위·변조 방지기술이다. 스타벅스는 작년 한 해 동안에만 무려 38만 곳의 커피 농장에서 원두를 구매해서 매장에서 커피로 내려서 팔거나 혹은 원두 그 자체로 판매한다. 이렇게 판매되는 원두들이 어디에서 생산돼서, 어떻게 여기까지 왔는지를 투명하게 제공하는 것은 원두의 품질 관리와 소비자의 신뢰 확보에 중요한 요소였다. 이를 위해 스타벅스는 빈 투 컵(Bean to cup) 프로그램이라는 이름으로 원두 산지와 유통과정을 모두 기록하고 최종 포장에 담아 소비자들에게 전달되기까지의 과정을 블록체인을 구성해 제공하기 시작했다. 소비자들은 스마트폰 카메라 등을 이용해 원두 포장에 부착된 마크를 인식하면 해당 원두의 생산지를 즉시 확인할 수 있었고 구매한 커피의 출처와 재배지, 나아가 해당 지역의 농부를 지원하기 위해 스타벅스가 무엇을 하는가에 대한 정보도 확인할 수 있다. 커피가 언제 로스팅됐는지, 시음 후기를 기록한 테이스팅 노트와 기타 세부 정보까지 제공 할 수 있게 되었다. 고객들만 좋아진 것이 아니다. 스타벅스 측에서는 커피 산지에 대한 고객의 선호도를 분명히 알 수 있었고 해당 산지에 대한 평판까지 추가로 관리할 수 있게 됐다. 또 좋은 원두를 생산하는 농민들을 보호할 수 있게 됐고, 가격을 산정할 때 좋은 원두에 더 높은 가격을 매길 수 있어 원두의 품질 향상도 기대할 수 있게 됐다. 커피 시장의 중요한 요소인 공정무역의 가치를 블록체인을 통해 검증하고 공개할 수 있게 된 것이다.

블록체인 기술은 시작에 불과했다. 스타벅스는 IoT 기술도 적극적으로 도입했다. 전 세계 3만 개의 스타벅스 매장에서는 커피머신부터 그라인더와 믹서 등 12종 이상의 장비가 하루 16시간 이상 바쁘게 돌아간다. 이런 장비들의 고장은 매출에도 문제가 되겠지만 무엇보다 고객 서비스 품질을 떨어뜨릴 수밖에 없다. 그래서 스타벅스는 많은 종류의 장비를 원활하게 관리하기 위해 클라우드 기반의 IoT 기술을 활용하기로 했다. IoT의 핵심은 수많은 종류의 하드웨어를 통합해 하나의 서비스로 연결하는 것이고 또 단순히 연결만 한다고 IoT가 완성되는 것도 아니었다. 연결에 필요한 통신 프로토콜이나 보안, 인증과 같은 다양한 문제도 하나씩 해결해 나가야만 했다. 이런 문제는 소프트웨어적으로 해결할 수도 있었고 새로운 하드웨어를 설계하는 것으로 해결할 수도 있었다.
이런 과정들 덕분에 압력, 물의 양, 온도, 콩 종류 등을 실시간으로 파악하고 기계 상태가 미묘하게 변화하는 순간까지 포착할 수 있게 되면서 품질 관리가 이전보다 쉬워졌다.


그림3 스타벅스 CEO 캐빈존슨(Kevin Johnson) Big Show 2020 발표 모습(출처 National Retail Federation)
<그림3> 스타벅스 CEO 캐빈존슨(Kevin Johnson) Big Show 2020 발표 모습(출처 National Retail Federation)


스타벅스는 AI를 도입해서 고객에서 맞춤형 서비스를 제공할 수 있게 되었다. 이를 위해서 먼저, 강화 학습 플랫폼을 사용해서 사용자들의 주문들과 구매 이력을 분석한다. 여기에는 개인의 취향과 기호를 비롯해 날씨, 시간 등의 정보까지 모두 분석의 대상이 된다. AI는 이렇게 이전 주문 내용을 참고해 사용자들이 만족할 만한 메뉴를 정교하게 예측해 제안하는 데 스타벅스는 이렇게 자체적으로 개발한 메뉴 추천 서비스를 ‘딥 브루(Deep Brew)’라고 이름 붙였다. 딥 브루를 기반으로 한 서비스는 일반 매장은 물론, 이동 중에도 활용할 수 있도록 스타벅스의 ‘드라이브 스루’ 매장에서도 제공된다. 드라이브 스루 매장의 경우 자동차를 몰면서 제한된 화면 안에서 메뉴를 고르기가 힘든 환경을 고려해서 운전자들을 위해 신속하면서도 후회 없는 선택을 하도록 도와주는 것이다.

흔한 말로 스타벅스는 ‘커피를 파는 회사가 아니라 문화를 파는 회사’라는 표현을 많이 사용한다. 스타벅스는 이런 자기만의 문화를 더 발전시키기 위해서 데이터를 적극적으로 사용하고 있다. 고객들은 그런 스타벅스에서 커피를 마시고 간단한 식사를 하는데 편안함과 또 다른 형태의 세련됨을 느끼고 있고 그 결과는 코로나 시대에도 꿋꿋한 매출과 주가로 나타나고 있다.

데이터 혁명 작게 시작하라.

데이터 혁명이라고 하면 거창할 것 같지만 사실은 매우 작은 것부터 시작해서 성과를 쌓아가고 키워나가는 것이 중요하다. 데이터 혁명을 위해서 아래와 같이 세 가지 방법을 제안하려고 한다.


1. 일상적인 업무 속의 데이터 수집
데이터 혁명이라고 해서 대단한 프로젝트를 시작하려고 하면 결국 성과를 내기도 전에 좌절하기 쉽다. 일상에서 일어나는 문서들과 반복적인 업무부터 수치화하게 되면 불필요한 업무와 더 중요한 업무를 구별할 수 있게 될 수 있을 뿐만 아니라 업무의 효율을 높일 방법들을 찾을 수 있게 된다. 또 이렇게 데이터 기반으로 잘 수치화된 지표들은 의사 결정자들을 설득하는 데도 효과적인 수단이 된다. 데이터의 수집과 분석을 위해서 전문 과정을 수료하고 데이터 분석 도구를 도입해서 분석하는 것도 방법이겠지만 이미 대부분 설치되어 있는 엑셀이 이미 훌륭한 도구이다. 데이터 전문가들도 보면 엑셀을 사용하고 있다. 특히 엑셀에 무료로 사용 할 수 있는 추가 기능만 사용해도 기본적인 통계 기술들을 모두 활용 할 수 있다.

2. 공공데이터의 적극적인 활용
내가 수집하는 데이터뿐만 아니라 이미 공개된 공공데이터를 적극적으로 활용하면 얻을 수 있을 것이 많다. 공공데이터를 제공하고 있는 곳 중에 대표적인 곳이 바로 국가 통계 포탈(https://kosis.kr)이다. 국가 통계 포털에서는 인구, 물가, 경제 일반뿐만 아니라 다양한 정보를 찾아볼 수 있으며 엑셀이나 원하는 형태로 데이터를 가공해서 다운로드하는 것이 가능하다.


그림4 국가통계 포털
<그림4> 국가통계 포털


3. 성과의 공유와 확산
데이터를 기반으로 한 소기의 성과를 얻었다면 이를 공유하고 확산하고 적용해 보는 과정이 사실은 제일 중요하다. 이런 과정이 없다면 단편적인 작업으로 끝나고 실제 하나의 문화로 정착되어서 지속적인 효과를 내기 어렵다. 이런 문화를 정착하기 위해서 소기의 보상도 함께 고민해 볼 필요가 있다.

데이터는 이미 우리 주위에 충분히 있다. 또 조금만 찾아보면 데이터를 활용하기 위한 과정과 콘텐츠도 정말 많아졌다. Microsoft의 사티아 나딜라 CEO는 이렇게 이야기한다. ‘All company is AI company’ 이제는 데이터로부터 그리고 IT 기술로부터 자유로울 수 있는 사람은 없어진 것 같다.






김영욱 대표
현) Hello AI 대표
전) Microsoft Development and Platform 사업부 근무