데이터 사이언스 캔버스

데이터 분석은 비지니스의 문제를 해결하거나 유용한 정보의 발굴을 통한 새로운 가치를 창출하기 위해 데이터에 대한 과학적 분석을 수행하는 일련의 과정으로 정의할 수 있습니다. 이를 위해서는 수학 ·통계학 ·컴퓨터과학· 산업공학 등의 기술 습득 뿐만 아니라 각 비즈니스 영역의 업무 경험과 데이터 분석 역량이 필요 합니다.

데이터 분석은 이제 산업과 기업의 주요 의사결정의 핵심 요소로 자리잡고 있습니다. 데이터 과학 기술을 습득하는 과정은 쉽지 않을 뿐만 아니라 시간이 걸리는 과정이지만, IT기술과 업무 노하우를 최대한 활용하여 융합 하면 보다 효율적이고 신속하게 데이터 과학 과정에 입문 할 수 있을 것입니다.

데이터 사이언스 캔버스는 10여년 동안 제조· 공공· 금융 등 다양한 산업 현장과 시민 데이터 과학자(Citizen Data Scientist) 양성 교육 과정을 통해 획득한 자산을 체계화하고 비즈니스 모델 캔버스①와 다산 정약용 선생님의 치학(治學) 전략②을 접목하여 개발한 데이터 과학을 위한 도구입니다.

데이터 사이언스 캔버스는 시티즌 데이터 과학자들이 사용자의 수준에 맞는 분석 가이던스와 분석 결과를 활용 할 수 있는 분석 주제별 분석 참조 모델을 제공하여 기업 현장의 업무 전문가 또는 엔지니어가 빠르고 쉽게 데이터 분석 프로젝트에 참여 할 수 있도록 합니다.

① 2005년 알렉산더 오스터왈더의 비즈니스 모델 캔버스 및 루이스 도라드의 머신러닝 캔버스 참조
② 2006년 정민(한양대 인문과학대학)의 다산 선생 지식 경영법(김영사) 참조

 

 

① 데이터 분석 가치 제안

데이터 분석 결과의 활용을 통해 창출 하려는 가치를 제안합니다.

※ 데이터 분석을 통해 현장의 문제점을 해결하기 위한 활동 계획을 분석 주제로 정의 합니다.

② 데이터 소스

업무현황 파악을 통해 데이터 분석에 사용 가능한 대상 데이터를 선정합니다.

③ 데이터 수집

데이터 소스로부터 분석 모델의 필요 데이터 수집을 위한 기술적인 검토와 수집 데이터를 확정합니다데이터 수집 방법을 파악하고 데이터의 속성/수집 주기 등에 대해서 파악을 해두어야 합니다이 과정에서는 수집된 데이터를 저장/관리하는 방안에 대해서도 선정해 두어야 합니다.

 

④ 데이터 전처리 / 데이터 탐색

분석결과의 신뢰성  확보를 위해서는 분석 모델에 입력 할 데이터의 오류와  결측값 등을 파악하여 안정적인 데이터 확보 방안을 마련해야 합니다.

수집데이터의 기초 통계량과 시각화상관 분석 등을 통해 데이터에 대한 통찰을 얻도록 합니다

⑤ 모델 학습/평가

적합한 통계적 방법데이터 마이닝머신 러닝 등의 분석 방법을 선정하며 모델 생성을 위한 학습 → 검증 → 평가 과정을 수행합니다.

⑥ 데이터분석 워크플로우

분석에 사용된 데이터를 중심으로 데이터 분석 작업의 시작과 끝을 설계합니다. “데이터 소스 → 수집 저장 → 데이터 전처리/데이터 탐색 → 분석 모델링 → 분석 결과” 의 단계별 데이터 입출력 관계와 작업 주기를 정리하여그 동안의 분석 과정을 현장에 적용하기 쉽도록 기술하는 과정 입니다.

⑦ 데이터 분석 활용 시나리오

분석 결과로부터  인사이트를 발굴하고 의사결정에 반영하는 방법을 선택합니다분석 결과에 활용된 데이터들의 특성에 적합한 다양한 차트와 시각화 도구를 이용하여 분석 결과를 비즈니스에 활용하는 시나리오를 개발합니다.

⑧ 운영 평가/모니터링

분석 결과를 안정적으로 활용하기 위해서는 운영 시스템에 적용한 후 분석 모델을 관리하고모델의 성능을 모니터링 하는 작업을 지속해야 합니다또한 정기적으로 학습 모델의 성능을 관리하기 위한 모니터링 지표 값을 정립해야 합니다.

 

 

출처) Citizen Data Scientist를 위한 데이터 사이언스 캔버스
지은이 ㈜ 베가스 R&D Center

3

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다

데이터산업 관련 최신 뉴스를 추천받아보세요.

매주 온라인 데이터산업 주요 이슈를 한번에 파악할 수 있도록 정리하여 제공해드립니다.


개인정보 처리방침 보기