1. 데이터 분석을 통한 가치 창출 |
데이터 사이언스 캔버스는 “비즈니스 이슈를 분석에서 어떻게 가치를 창출하고 분석 결과를 어떻게 현장에 적용하는가” 를 논리적으로 기술한 것이라 정의할 수 있습니다.
더 나은 방향과 성공을 향해 비즈니스 이슈를 해결해 나가는 것을 혁신이라 한다면 데이터 과학은 궁극적으로 기업, 고객 그리고 산업 현장을 위해 가치를 창출하는 것입니다. *데이터 분석을 통한 가치 제안 = 데이터 분석 과제 비즈니스의 복잡도가 증가하는 시장 안에서는 의사 결정에 도움이 되는 데이터 분석 결과를 얻기가 매우 어렵습니다. 또한 비즈니스의 속도가 중요해진 지금은 데이터 분석 과제를 수행하는데 있어서 계획을 세우기(planning) 보다 모델을 디자인하면서 진행하는 ‘디자인 씽킹’ 전략이 효율적입니다. |
|
<블록 체크리스트>
ㆍ분석 주제를 정의하기 위해서는 해당 업무 파악을 통해 문제점을 도출 정립
|
|
데이터 분석 가치 제안 블록 활용법 |
분석 주제 정의
‘데이터 분석을 통해 업무의 이슈를 개선하거나 신규 업무 개발의 방향 설정 등 비즈니스 가치 창출이 가능한 주제를 정의하는 것 입니다.’ 분석 주제 정의는 실제 분석을 수행하기에 앞서 분석을 수행할 과제의 정의 및 의도했던 결과를 도출할 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업입니다. 분석 과제 수행을 통해 어떠한 목표(What)를 달성하기 위하여(Why) 어떠한 데이터를 가지고 어떤 방식으로(How) 수행할 지에 대한 일련의 계획을 수립하는 작업이기 때문에 성공적인 분석 결과를 도출하기 위한 필수 작업입니다. 업무 요구 파악, 이슈 및 쟁점사항 도출 분석 과제는 다양한 비즈니스 문제를 데이터 분석 문제로 변환하고 이를 바탕으로 “데이터 분석 과제 정의서”를 작성하고 분석 과제로서의 타당성을 검토하여 발굴된 과제로 확정합니다. 과제 발굴에는 하향식 접근 방법(Top Down Approach)과 상향식 접근 방법(Bottom Up Approach)이 있다. |
|
과제 발굴 접근 방법 |
As-Is
‘업무 영역의 현 상태에 대한 진단을 통해 분석 주제와 연관된 문제점을 도출합니다.’
현장에서는 어떤 것들이 주로 문제가 될까요 업종에 따라 작업장 마다 다른 문제를 가지고 있을 것입니다. 하지만 비슷한 고민들을 하고 있기도 합니다.
다음과 같은 두 가지 경우를 생각해봅시다.
첫 번째는, 회사에서 판매하고 있는 ‘어떤 상품의 매출이 떨어지고 있다.’라는 문제입니다.
상품의 매출이 떨어지고 있다면 분명 큰 문제일 것입니다. 하지만 이 상품이 회사에서 주력 상품이 아니거나 곧 판매가 중단될 상품이라면 큰 문제가 되지는 않을 것입니다. 물론 회사의 수익에 큰 영향을 미치는 주력 상품이라면 문제가 될 수 있습니다.
두 번째는, 반대로 회사에서 판매하고 있는 ‘어떤 상품의 매출이 오르고 있다.’라는 문제를 생각해봅시다.
매출이 오르는 경우도 문제가 될까요? 보통은 매출이 오르는 상황이라면 특별히 문제가 되지 않을 것 같으나 ‘상품에 들이고 있는 광고비에 맞지 않는 매출 상황’ 이라면 문제가 될 수 있습니다.
‘분석 주제로 정의한 비즈니스 문제점에 대한 목표를 설정해야 합니다. 문제점이 해결되었을 때의 목표 수준은 정량적으로 나타내야 합니다.’
‘매출이 떨어지고 있다’ 혹은 ‘불량률이 증가하고 있다’ 등을 현장에서는 ‘문제’로 다룹니다. 그러나 데이터 분석에서
이러한 것들은 단지 ‘현상’에 불과할 수 있습니다. 이러한 ‘현상’을 가지고 담당자와 논의하여 해결해야 할 ‘문제’를 찾
아내는 것이 중요합니다.
현장과 목표를 공유하는 것을 데이터 분석에서는 ‘문제의 발견’ 이라고 합니다. ‘현상(As-Is)’이 공유되고 ‘To-Be’
가? 공유되었을 때 데이터 분석을 수행할 토대가 마련되었다고 할 수 있습니다.
데이터 분석을 통해 As-Is와 To-Be의 차이가 나는 원인이 무엇인지부터 검증해 나갈 수 있습니다.
현상 | As-Is | To-Be | 문제인가? |
---|---|---|---|
매출이 떨어졌다. | 매출 비율이 낮다. | 지금 상태로 OK | 문제 아님 |
매출 비율이 높다. | 호경기 매출 | 문제 | |
불량률이 올랐다. | RPM이 높다. | RPM을 낮춤 | 문제 |
RPM이 적절하다. | 지금 상태로 OK | 문제 아님 |
‘As-Is’와 ‘To-Be’의 차이를 파악하기 위해서는 다음의 3가지 관점에서 문제를 살펴보아야 합니다.
1. 요인의 전체 영향도 찾기
2. 분해해서 차이 파악 하기
3. 비교해서 차이 파악 하기
대상 데이터
‘데이터 분석에 사용 할 대상 데이터들로 데이터 후보군을 선정합니다.’
1. 문제를 검증하기 위해 어떤 데이터가 필요한가?
2. 필요한 데이터가 보존되어 있는가?
3. 필요한 데이터를 사용할 수 있는가?
4. 데이터가 보존되어 있지 않을 경우, 새로 데이터를 취득할 수 있는가?
5. 새로 데이터를 취득하는데 시간이나 비용이 많이 들 경우, 대체할 수 있는 데이터가 있는가?
데이터를 취득하는데 시간과 비용이 많이 들긴 하지만, 데이터를 새로 취득해서 얻는 분석 결과가 현장에 미치는 효과가 크다고 판단되면 새로 취득하는 것을 검토해 보아야 합니다.
구분 | 인적자원 | 분석 인프라 | 비고 |
---|---|---|---|
분석 전문가 | 데이터 엔지니어 | HADOOP, SPARK, SQL 등 | |
데이터 분석가 | R, PYTHON, H2O 등 | ||
실무 담당자 | 업무 담당자 | 시각화 도구 | |
데이터 관리자 | 빅데이터 플랫폼 |
일정 계획
‘데이터 분석을 수행하기 위한 일정계획을 수립합니다.’
일정 계획을 수립할 때는 업무량, 데이터 수집에 걸리는 시간, 분석의 난이도, 목표 사업 기간, 소요 인력, 예산 등에 기초해서 작성해야 합니다.
실제 수행하는 작업 단위를 기준으로 작성하되 작업 단위는 5일 이내에 수행 가능한 작업으로 나누어서 관리하는 것이 좋습니다. ‘매출이 떨어졌다/불량률이 올랐다.’ 등은 As-Is 현상입니다. 이것을 ‘To-Be’와 연결하여 ‘As-Is’와 ‘To-Be’의 차이가 어떤 구조인지 분석하는 것이 문제가 나타난 근본적인 원인을 파악하기 위해 필요한 작업이 됩니다.
|
|
출처) Citizen Data Scientist를 위한 데이터 사이언스 캔버스 지은이 ㈜ 베가스 R&D Center |