데이터이야기

DB 노하우, 데이터직무, 다양한 인터뷰를 만나보세요.

견고한 분석 - (5) 분석 기술을 연마하는 법

데이터 이야기
작성자
dataonair
작성일
2017-02-17 00:00
조회
2740


견고한 분석- (5) 분석 기술을 연마하는 법



사람은 누구나 특정 분야에서 두각을 나타낼 수 있는 자기만의 능력을 타고난다고 합니다. 하지만 이런 능력도 연습 없이는 어떤 기술도 습득할 수 없습니다. 데이터 분석 기술도 이와 같다고 할 수 있습니다. 좋은 데이터 분석 습관을 들이려면 먼저 분석 실력을 향상시키겠다는 목적 의식을 분명히 하고 연습하는 것이 중요합니다. 생각없이 습관에만 따라서는 목적을 이룰 수 없습니다. 그럼에도 불구하고 수많은 데이터 분석가들이 목표에 한걸음씩 다가가고 있는지 확신하지 못한 채 이 과제 저 과제에 끌려 다닙니다.

더 나은 데이터 분석 능력을 갖추려면 먼저 풀어야 할 분석 과제를 인식하고 과제의 문제가 무엇인지 데이터 분석을 통해 개선할 수 있는 것이 무엇인지 하는 것들을 분명히 정의하는 습관을 들여야 합니다. 가치 있는 사고는 문제 정의, 현재의 방식에 대한 의심 그리고 깊은 고민에서 비롯되기 때문입니다.

나쁜 습관을 가진 분석가는 문제를 제대로 보지도 않고 분석을 시작합니다. 그러다 마침내 문제에 맞닥뜨리면 그게 어떤 문제인지, 어떻게 답해야 하는지 알 수가 없습니다. 반면 생각하는 습관을 들인 사람은 문제를 이해하고 데이터 분석의 목적을 분명히 하여 그것을 꼼꼼하고 정확하게 해결하는 방법을 이미 알고 있습니다. 분석을 시작하기 전에 벌써 조사하고 검토해 보았을 것이기 때문입니다. 따라서 이러한 분석가는 어디서 와서 어디로 가는지도 모른 체 과제에서 떠돌아 다니는 일이 없습니다.

많은 데이터 분석 기술을 한꺼번에 몸에 익힐 수 있을 거라 기대해서는 안됩니다. 쉬운 방법부터 시작하여 어려운 기술들을 익혀 가는 것이 좋겠습니다. 그러나 무엇보다 먼저 데이터 분석에도 나쁜 습관이 있다는 것을 아는 것이 필요하겠습니다. 초보 분석가들은 아직 분석이 습관으로 붙어 있는게 아니니 나쁜 습관이 들지 않도록 처음부터 유념하는 것이 좋겠습니다. 그리고 경험이 있는 분석가들은 본인에게 있는 나쁜 습관을 한 두개씩 좋은 습관으로 서서히 바꿔가도록 노력하는 것이 현명합니다. 이 모든 것이 완전히 몸에 익을 때까지 끊임없이 반복해야 합니다.

분석 능력은 협력을 통해 얻을 수 있습니다. 분석 리더에게 건설적인 비판을 받아 본 적이 있습니까 분석가에게는 여전히 많은 것이 새롭고 낯설지만 분석 리더는 다년간 경험을 통해 풍부한 지식을 가지고 있습니다. 예컨데, 문제를 해결 하려할 때 거쳐야 하는 기본적인 과정, 표와 그래프를 읽는 방법, 과제의 핵심 질문이 무엇인지 등을 잘 정리해 낼 수 있습니다. 다른 사람의 경험으로부터 무언가를 배우기를 주저해서는 안됩니다. 다른 분석가에게도 많은 것을 배울 수 있습니다. 왜 어떤 분석가는 더 좋은 결과를 내는가 뛰어난 분석가의 명료하고 정연한 분석 자료와 비교했을 때, 내 과제 보고서는 어떤 점이 부족한가 등과 같은 질문에 대해 계속 답을 찾아 나가야 합니다.

뛰어난 데이터 분석가가 작업하는 과정을 살펴보면 좋은 분석 결과를 얻기 위해서는 어떻게해야 하는지에 대한 실마리를 얻을 수 있을 것입니다. 누구나 자기가 가장 좋아하는 운동이나 취미 생활을 할 때와 같이 데이터 분석 능력 또한 향상 시킬 수 있습니다.



기본 분석법의 응용

모든 데이터 분석 기술은 다음의 세가지 기본적인 기술에서 나옵니다. 그 기술이란 특별한 것이 아닙니다.

(1) 필요한 내용 찾기
(2) 찾은 내용 기억하기
(3) 적절히 활용하기

입니다. 책을 읽는 방법과 비슷하다고 할 수 있습니다. 데이터 분석이란 데이터를 읽는 기술이라고 할 수 있기 때문에 책을 읽는 방법과 비슷한 기술이 필요합니다. 이 기술을 응용한 분석법 사이에는 근본적으로 큰 차이가 없습니다. 이 세가지가 모든 데이터 분석 기술의 가장 중요한 구성 요소라는 것을 명심하고 각자에게 맞게 이용하도록 합니다.

이 세가지 데이터 분석의 기본 기술에 바탕을 둔 데이터 분석 절차는 다음과 같이 4 단계로 간단하게 정리해 볼 수 있습니다.

(1) 수집된 데이터에 대해 사전 조사 하기 : 데이터 양, 데이터 항목들의 형식, 수집 주기, 수집 목적 등 ? 필요한 내용을 찾기 위한 분석 재료 찾기
(2) 탐색적 자료분석 결과의 요점을 이해한 후, 목표변수(Y)를 기준으로 각 설명변수(x)들에 대해 가설 등을 질문의 형태로 재구성하기 ? 필요한 내용 찾기
(3) 분석한 내용을 재빨리 훑어보면서 그 의미나 내용을 즉시 떠올릴 수 없는 규칙 등이 있으면 확실히 기억해 두기 ? 찾은 내용 기억하기
(4) 분석한 내용을 간략하고 논리적으로 요약하기 ? 적절히 활용하기

데이터 분석은 분석 내용을 요약하여 발표하는 과정을 통해서도 많은 걸 배울 수 있습니다. 발표 자료를 작성하다 보면 아래에 제시된 논리적 요소들로 머릿 속에 그림을 그릴 것입니다.

(1) 분석 과제가 포괄하는 내용은 어디서부터 어디까지 인가
(2) 어떤 순서 또는 단계를 밟아 과제 분석을 수행하였는가
(3) 핵심 내용은 무엇인가 즉, 데이터 분석의 궁극적인 목적은 무엇인가
(4) 과제가 전하려는 내용이나 의미는 무엇인가

분석해야 할 데이터를 빠르게 훑어보는 방법인 탐색적 자료분석을 끝내고 나면 “여기서 무엇을 배워야 하는가” “데이터가 말하려는 것이 무엇인가” 라는 질문들이 먼저 머리에 떠오를 것입니다. 보통 이런 질문들을 떠올리고 답을 유추 해보는 이 간단하고도 중대한 과정을 생략하고 출발하기 때문에 분석에 임할 자세를 갖추는데 실패합니다.

‘분석 기술’의 첫번? 공식은 분석을 시작하기 전에 먼저 질문을 던지는 것입니다. 탐색적 자료분석이나 유도변수 만들기 등은 질문을 찾는데 있어 좋은 출발이 될 수 있습니다. 이 과정에서 얻은 키워드들을 이용하여 적합한 질문을 만들어 나가는 것입니다. 키워드들을 이용하여 분석 가설을 구성한 다음 분석의 방향을 잡아 나가고, 데이터 분석을 통해 가설들에 대한 답을 찾는 것입니다. 좋은 질문이 알맞은 대답의 출발점이라는 것은 잘 알려진 사실입니다. 질문을 만들고 그 질문에 대한 답을 찾아 가는 과정이 데이터 분석 과정이며 그 과정에서 ‘분석 기술’을 분석 방법론만으로 생각하는 것은 첫 단추를 잘못 끼우는 것과 같습니다.



데이터 분석의 성공은 흥미에서 시작된다.

분석 결과는 절대 수동적이거나 기계적으로 전달되어서는 안됩니다. 그렇게 전달된 내용은 쓸모 없는 정보일 뿐입니다. 정보는 이해라는 능동적인 과정을 통해 분석가와 분석 의뢰자의 일 자체를 혁신 시켜야 합니다. 분석가에게는 즐겁게 분석할 책임이 있습니다. 누구도 대신 흥미를 느껴줄 수 없으며 스스로 노력하지 않는 한 분석을 더 재미있게 만들어 줄 수 도 없습니다. 분석에 흥미를 느껴야 한다는 기본 의무를 충실히 수행하는 것은 데이터 분석에서 성공하기 위한 필수요건 입니다. 예술가란 가능한 최선의 방식을 택해 할 수 있는 한 완벽하게 그 일을 해내는 사람들입니다. 따라서 제대로 분석하기를 원하는 사람이라면 예술가와 같은 자세로 분석을 추구해야 합니다. 분석 과정에서는 일견 재미없을 것 같은 분석을 수없이 시도해야 합니다. 흥미는 의지와 노력의 결과입니다.



출처 : 한국데이터진흥원

제공 : 데이터 전문가 지식포털 DBguide.net