데이터 인터뷰

DB 노하우, 데이터직무, 다양한 인터뷰를 만나보세요.

“나는 달리는 데이터 분석가” - 김재우 KAIST 소셜컴퓨팅랩의 데이터 분석 박사과정

DATA 인터뷰
작성자
dataonair
작성일
2016-11-21 00:00
조회
3439



데이터로 카레이싱의 안전과 속도 한계에 도전

“나는 달리는 데이터 분석가”

 

안전하게 목표 지점에 최대한 빨리 도착해야 하는 카레이싱. 데이터 분석을 전공하는 박사 과정의 한 학생이 어렸을 적 꿈을 이루기 위해 데이터 분석 기반의 카레이싱에 도전해 눈길을 끌고 있다. KAIST 소셜컴퓨팅랩의 박사 과정에 재학중인 김재우 씨가 그 주인공이다. 데이터 분석과 카레이싱의 교차점에서 발전 방안을 모색하고 있는 김재우 씨의 이야기를 들어보았다.

in_025.jpg

▲ 김재우 KAIST 소셜컴퓨팅랩의 데이터 분석 박사과정

데이터 분석을 공부하면서 카레이싱 선수로 활동한다는 게 특이하다.

학부와 석사 과정까지 기계공학을 공부했다. 박사 과정부터 소셜컴퓨팅랩에서 데이터 분석을 공부하고 있다. 소셜 데이터를 가공-분석하는 일이므로 사람으로부터 만들어진 데이터를 많이 다룬다. 어릴 때부터 운동선수가 꿈이었다. 스스로 신체 훈련에 관심이 있어서 고등학교와 대학 때 축구 동아리에서 활동했었다. 더 늦기 전에 그 꿈을 이뤄보고 싶어서 대학원 과정 중 레이싱 선수로 데뷔했다. 바랐던 그 꿈에 다가섰다고 볼 수 있다. 현재는 주말을 제외한 평일에 매일 5Km씩 달리기를 하고 요가를 병행하면서 신체 훈련을 하고 있다.

카레이서에게도 체력이 중요한가.

‘자리에 앉아서 운전을 하는데 웬 운동이냐?’고 할 수 있다. 경주용 자동차는 에어컨이 없어서 내부 온도가 40~50도까지 올라간다. 레이싱 복장을 하고 무더운 차 안에서 1.3G 이상의 쏠리는 중력 가속도를 견디려면 항상 체력과의 싸움이 된다. 마치 줄에 매달려 있는 상태라고 볼 수 있다. 이 쏠림 때문에 머리로 피를 보내려는 심장에 무리가 간다. 키가 작으면 심장에 무리가 덜 가기 때문에 아담한 키의 레이서가 많다. 수준 높은 카레이서는 심폐기능이 뛰어난 선수들로 볼 수 있다. 카레이서에게는 극한 상황에서 순간 대처할 수 있는 판단력이 매우 중요하다. 숨이 차면 판단력이 흐려져 그만큼 위험에 노출될 가능성이 올라가게 된다. 이를 위해 심폐 활동력과 지구력을 쌓는 훈련을 하고있다. 요가는 자동차를 내 몸처럼 균형을 잡아야 하므로 도움이 된다.

하나만 해도 쉽지 않다는 박사 과정 중에 카레이싱 선수 활동이 가능한가.

평소 (레이싱) 연습시간이 부족해서 나만의 방법을 쓰고 있다. 부족한 연습만큼 시합 중에 확보했던 각종 데이터를 다시 한번 살펴보면서 개선할 점을 모색한다. 최근의 자동차는 센서 덩어리이므로 연습과 시합 중에 자동차로부터 얻는 데이터와 운전상황과 신체 활동을 모니터링하는 외부 센서로 취합한 다양한 데이터를 분석/관리하고 있다.

어떤 데이터를 주로 분석하나.

크게 세 가지 데이터다. 첫번째로 경기 중에 스포츠 캠코더로 상황을 녹화한 영상 데이터다. 두번째는 대처능력 측정을 위한 스티어링 앵글 센서와 엑셀 및 브레이크 센싱 데이터다. 세번째는 대처 후 차량의 움직임, 즉 차량의 모션 데이터다. 차량의 속도, GPS 기반의 위치정보, 가속도 및 회전운동 정보 등이 모션 데이터에 속한다.

보통 자동차 경주 데이터 가운데 크기가 큰 것은 30분 정도 되는 경기 영상이다. 나머지 센서로부터 수집하는 데이터는 보통 숫자로 이뤄졌으므로 용량이 크지 않다. 대신 최대 100Hz 단위로 데이터가 갱신되므로 매우 세밀한 데이터다. 일반적인 스포츠에서 사용되는 데이터, 예를 들면 사람의 심박계 모니터링을 1초에 100회에 이르는 속도로 할 필요는 없다. 하지만 자동차는 빠른 속도로 움직이므로 10~100Hz 단위로 리프레시할 필요가 있다.

in_026.jpg

카레이싱에서 데이터 분석이 일반적인가.

요즘의 해외 카레이싱팀은 보통 데이터 엔지니어가 포함된다. 데이터 엔지니어는 끝없는 숫자의 나열 속에서 통찰을 얻어 선수의 경기력을 끌어올리는 역할을 한다. 데이터 분석을 공부하고 있고, 경기 중에 데이터를 모을 수 있어서 혼자 선수와 데이터 엔지니어의 역할을 겸하고 있다. 수집한 데이터를 분석하다 보면 경기 중에 개선해야 할 부분을 스스로 찾게 된다. 현재로서는 카레이싱 데이터를 분석해 기술을 개선하는 데 기여하는 게 목표다. 카레이싱 데이터를 분석하는 것은 매우 전문 영역이다. 카레이싱 데이터 분석이 떠오르기 전까지는 팀의 경기력 향상을 위해 레이서의 경험에 의존했는데, 데이터 공학이 접목되면서 시행착오와 비용을 크게 줄일 수 있게 되었다. 최근, 기계학습이 이슈가 되면서 개인적으로 레이싱 데이터에 머신러닝 기술을 적용하는 형태의 접근을 시도하고 있다.

카레이싱 데이터에 관심을 갖게 된 배경은.

레이싱 데이터는 한마디로 운전의 비밀을 담은 데이터다. 자동차 자율주행이 아직 명쾌하게 풀리지 않은 상태다. 레이싱카 운전자들이라면 이 세상에서 운전을 가장 잘하는 부류에 속할 것이다. 그들이 만들어 내는 데이터세트가 자율주행을 연구하는 데 가장 좋은 데이터라고 볼 수 있다. 레이스의 대전제는 안전을 최대한으로 유지하면서 최대한 빨리 목표지점에 도달하는 것이다. 일반도로에서의 운전도 궁극적으로 추구하는 지점은 레이싱과 마찬가지라고 생각한다. 레이서들의 운전을 모사할 수 있다면, 가장 진보한 형태의 자율주행 알고리즘을 도출할 수 있을 것이다.

in_027.jpg

(사진 협조: 김재우)

데이터 분석을 통해 카레이싱을 연구하는 만큼 남다른 경험도 많을 거 같다.

3년 간 20여 경기에 참여했다. 30분 정도 경주를 하고 나면, 1년 정도를 보낸 느낌이 든다. 시간의 압축을 경험한다고나 해야 할까? 선수끼리는 1/100초로 승부가 갈린다. 일상에서는 0.1초 차이를 분간하기 어렵지만 경기 중에는 이게 느껴진다. 데뷔 후 세 번째 경기에 나갔을 때다. 예선 경기 중 실수로 경주용 차가 파손돼 결승 경기에 나가지 못할 상황이었다. 그 상황에서 같은 팀 동료가 자신의 차 부품을 기증할 테니 경기를 계속하라고 양보해 주었다. 사고 나기 전까지 예선 1등으로 달리고 있던 상황이었다. 덕분에 선수로 데뷔해 처음으로 1등을 했다. 자신의 경기를 포기하면서까지 팀 동료에게 경기를 양보했던 그 선수의 몫까지 달려서 태어나서 처음으로 결승에서 우승했다. 매년 모든 경기를 종합해 시즌 순위를 발표하는데, 데뷔 첫해에 전체 2위를 기록했다. 이 정도라면 매우 이례적인 결과라고 한다.

데이터 분석이 경기력 향상에 도움이 되나.

도움이 된다. 레이싱 데이터를 분석해 얻은 통찰을 적용하여 경기력이 향상된 것을 확인했을 때 ‘데이터로 이런 거까지 할 수 있구나’ 하고 자신 스스로도 매우 놀란다. 데이터로서 레이싱 경기력을 끌어올릴 수 있다는 내 전제가 틀리지 않았음을 확인하면 매우 기쁘다. 경기장의 기술자들을 레이스 메카닉이라고 한다. 유명한 메카닉들은 경험지식이 풍부한 전문가들이다. ‘카페인모터큐브’라는 데이터 분석 기반의 자동차 정비 정보제공 업체에서 후원을 받고 있다. 이 회사는 경기용 자동차의 소모품 주기 데이터를 비롯해 다양한 정비 관련 데이터를 매우 정교하게 구축하고 있다. 레이스? 데이터를 통해 짧은 시간에 효과적으로 확보한 것이다. 이게 바로 기록과 분석의 힘이라고 생각한다. 물론 응원해 주시는 분들과 자신의 경기를 동료에게 양보했던 팀원 등 주변의 도움도 (경기력 향상에) 너무나 큰 도움이 되는 건 사실이다.

카레이싱은 매우 위험한 스포츠라는 생각이 든다.

부모님과 교수님께 카레이서를 하겠다고 했을 때, 염려하면서도 인정을 해주었던 것은 안전 운전을 할 것이라는 믿음이 있었기 때문이라고 생각한다. 그래서 늘 안전을 염두에 두고 연습과 경기를 하고 있다. 카레이싱에 대해 고민하고 공부하면서 삶의 태도도 다시 가다듬게 된다. 마치 경기를 하듯이 살게 된다고 해야 할까? 물론 얼마나 빨리 갈 수 있는지 경쟁적 관점에서 생각하는 것은 아니다. 생활 속에서 겪게 되는 많은 일 가운데서 자동차 경기 중에 느끼는 감정을 느낄 때가 많다. 나는 안전을 유지하면서 빠르게 달리는 자동차 주행에 미쳐 있다. 그러다 보니 사람을 만날 때마다 ‘이 사람은 이렇게 삶이라는 레이싱을 하고 있구나’ 하고 느끼곤 한다.

경기를 하다 보면 이기고 지는 걸 떠나 레이싱 자체가 즐겁다. 자동차 경기를 하면서 선수마다 생각이 바뀌면서 운전하는 모습을 보게 된다. 순간순간을 빨리 가야 직성이 풀리는 선수가 있는 반면, 나중에 큰 이익을 얻겠다고 여유를 갖고 달리는 선수가 보인다. 경기 중에 가장 크게 느끼는 바는 레이서들은 같은 목적을 갖고 달리지만, 그들의 움직임은 절대 예측이 불가능하다는 점이다. 상대가 내 손바닥에 있다고 생각하는 순간, 사고가 터진다. 경기의 핵심은 정확한 예측과 판단이지만 이게 틀릴 수 있다는 점을 항상 염두에 두고 있다. ‘100% 그럴 거’라고 예측한 순간 꼭 사고가 나곤 했다.

카레이싱 중에 느꼈던 특이한 경험이 있다면.

경기가 끝나면 그때만 느낄 수 있는 묘한 시간 감각이 있다. 분명히 30분 전에 본 사람인데도,경기 후에 다시 만나면 정말 오랜만에 만난 느낌이 든다는 것이 그중 하나다.

in_028.jpg

레이싱과 관련해 에피소드도 많을 거 같다.

데뷔 후 20회 이상 출전하여 15회 이상 입상하였다. 경기 중에 큰 사고를 낸 적 없이 안정적으로 운전을 한다. 한번은 스타트와 동시에 자동차가 고장이 났다. 레이스와 관련된 여러 속담이 있는데 ‘레이스에서는 어떤 일이든 일어날 수 있고 보통 그렇게 된다’는 말이 있다. 정말 이 말처럼 무슨 일이든 벌어지는데 출발과 함께 차가 고장나는 경험을 하면서 이 말이 가슴깊이 다가왔다.

카레이서에게 데이터 분석이란 무엇이라고 생각하나.

나는 머리와 몸을 구분할 필요가 없다고 본다. 두뇌도 신체 기관의 하나이기 때문이다. 나에게 레이스란 데이터 수집, 가설 세우기, 검증의 과정이다. 이 과정에서 사람의 신체는 매우 훌륭한 센서이자 패턴 인식 및 실행 도구이다. 그래서 요즘 국내 굴지의 자동차 회사들에서도 연구원들에게 몸으로 차를 알아야 한다고 강조하면서 드라이빙 교육을 실시하고 있으며, 이러한 교육 프로그램에 강사로 참여한 적도 있다.

“내 주변이 내 마음과 내 계획대로 움직이지 않는다고 생각하면, 지금 여기에 집중할 수 있다. 경기하던 상황을 되돌아보면, 이처럼 문득문득 깨닫는 게 있다. 그게 내게 교훈이 된다.”

선수생활과 학업을 병행할 수 있는 게 놀랍다.

술 담배 커피 게임을 하지 않는다. 선수 생활과 박사과정 대학원 공부를 어떻게 병행할 수 있느냐는 질문을 자주 받는다. ‘술 담배 커피에 게임까지 하지 않아서 가능하다’고 답하면, ‘세상 사는 재미가 뭐냐?’고 되묻는다. 한마디로 이 분야가 재미있고 잘 해보고 싶어서 가능한 일이다. 레이싱 중에 내 스스로의 심리상태를 체크하고 자세를 가다듬곤 한다. 내 주변이 내 마음대과 내 계획대로 되지 않는다고 생각하면, 지금 여기에 집중할 수 있다. 경기하던 상황을 되돌아보면, 이처럼 문득문득 깨닫는 게 있다. 그게 내게 교훈이 된다.

in_029.jpg

(사진 협조: 김재우)

레이서이자 분석가로서 일반 운전자에게 한마디 한다면.

두 손으로 운전을 하라고 당부하고 싶다. 차 핸들을 두 손으로 끝에서 끝으로 돌리면 1080도로 움직일 수 있다. 하지만 한 손으로 운전하면 120도밖에 움직일 수 없다. 이건 바로 상황 대처 범위를 의미한다. 한 손으로 하면 위기 상황 시 1/10밖에 대처할 수 없다는 말이 된다. 모든 상황을 정확히 예측할 수 있다면 사고가 나지 않겠지만, 예측할 수 없으므로 꼭 두 손으로 운전하기를 당부 드린다.

나이답지 않게 인생경험이 풍부한 느낌이 든다.

‘아재 같다’는 얘기를 듣곤 한다(^^). 생활에서 화가 별로 나지 않는다. 다른 사람들이 어떻게 할지를 내가 예측할 수 없고 예측대로 되지 않는다고 받아들이면 화가 나지 않는다. 이걸 레이싱 중에 내 스스로 깨달았다.

앞으로 목표는.

레이싱 데이터 연구가 간단한 것이 아니므로 내 인생을 걸어보고 싶다. 레이싱이라는 분야가 스포츠를 넘어서 공학에도 큰 기여를 할 수 있으리라 믿는다. KAIST의 자율주행연구팀과 협업할 계획이다. (끝)

출처 : 한국데이터진흥원

제공 : 데이터 전문가 지식포털 DBguide.net