데이터이야기

DB 노하우, 데이터직무, 다양한 인터뷰를 만나보세요.

제X차 MDM - 마스터데이터 선정 및 구축

데이터 이야기
작성자
dataonair
작성일
2018-02-07 00:00
조회
4879


제X차 MDM- 마스터데이터 선정 및 구축



권위수

소속 CSLEE
경력사항 컴퓨터시스템응용기술사, 데이터품질인증심사원, 기술가치평가사
- 마스터데이터 컨설팅 및 구축
- 공공 및 민간 기업 데이터 개방 및 품질 컨설팅(25개 수행)
- 데이터 모델링 및 ISP / 수석 컨설팅 (19년)
- 아이리포 기술사회 컬럼리스트
- 한이음 ICT 멘토링 주멘토



1. 마스터데이터의 개요

기준정보란 기업의 핵심 데이터로 자주 변하지 않으면서, 업무 및 프로에서 공통적으로 참조하고 활용하는 데이터를 의미합니다. 마스터데이터는 이벤트 데이터와 이력으로 구성되는 거래의 상대적인 개념이며 자주 변하지 않고 자료처리 운용에 기본이 되는 자료로 제공되는 데이터 입니다. 마스터데이터를 우리말로 기준정보라고 이야기 하며 이하 기준정보로 서술 하도록 하겠습니다.

기준정보 중심으로 관리되고 있는 여러 가지 데이터를 분류하여 보여주고 있습니다.

. column_img_3266.jpg

[그림-1] 기준정보 범위
기준정보는 종류를 업무 도메인 영역으로 살펴 보면, 공공은 주민, 사업자, 외국인 ,토지, 건축물, 자동차 등이 될 수 있으며, 금융은 고객, 상품, 채널, 제조는 제품, 자재, 공급사, 고객 등으로 관리되고 있습니다. 변동성이 거의 없는 기업의 핵심 데이터로 구성이 된다고 볼 수 있습니다.

column_img_3267.jpg

[표-1] 기준정보 유형

위 [표-1] 같이 기준정보 이외의 마스트데이터와 연관된 참조, 제어, 관리하는 데이터들로 여러 가지 관리되고 있습니다. 데이터 특성을 살펴보면Meta Data는 기준정보 모델 관리 및 스키마의 구조를 관리, Reference Data는 기준정보 코드성 데이터 관리, Control Parameter는 기준정보 환경을 관리, Condition Data는 기준정보의 제약조건 이나 범위를 관리하는 데이터로 구성이 되어 있습니다. 그리고 기준정보를 기반으로 생성되는 Transaction Data와 Analytical Data인 업무 데이터로 구분 됩니다.

기준정보를 설계 및 구축에 있어 가장 중요한 요소는 기준정보의 대상을 선정하는데 있다고 할 수 있습니다. 또한 기준정보를 구성 통한 프로세스 개선 및 데이터 관리체계가 없다면 기준정보 구성에 의미가 없다고 볼 수 있습니다.

이번 기고에서는 기준정보 목적, 대상 선정, 구축 방식 및 MDM 솔루션 기능을 대략적으로 알아 보도록 하겠습니다.



2. 마스터데이터 관리 목적

column_img_3268.jpg

분산 되어 있는 시스템의 기준정보를 중복제거 및 통합하고, 데이터 표준을 통해 일관성 있는 고 품질의 데이터를 사용자에게 제공함으로 비즈니스 업무 효율성 향상에 목적이 있다고 할 수 있습니다.



3. 기준정보 대상 선정 및 구축 방식

기준정보는 업무를 처리하는 과정에서 발생하는 자주 변하지 않는 중요 정보로서, 기준정보 선정 기준은 업무 처리의 주체, 객체, 장소 등에 해당하는 정보로 일반적으로 시간이 경과함에 따라 지속적으로 발생하는 Event(사건)성 데이터의 상대적 개념의 데이터 입니다. 또한 기준정보로 선정이 되더라도 각 업무 도메인에서 공통적으로 사용되지 않고 개별적으로 사용되는 경우에는 기준정보에서 선정에서 제외하는 것이 바람 직 합니다.

[표-2] 기준정보 선정 기준 및 사례

column_img_3269.jpg

기준정보를 정의 및 설계 후 설계에 적합한 기준정보를 구축 방식을 선정을 하게 됩니다. 시스템, 데이터 및 업무에 구축 방식이 따라 달라질 수 있기 때문에 신중하게 구축 방식을 고려 할 필요가 있습니다. 구축 방식은 Consolidation Style, Registry Style, Centralized Style, Coexistence Style 존재 합니다.

[표-3] 기준정보 구축 방식

column_img_3270.jpg

Consolidation Style 방식은 기간계 데이터을 정보계로 통합하는 DW 시스템에 주로 사용되는 방식 입니다. 실시간으로 정합성은 보장되지 않은 방식 입니다. Registry Style은 가상의 View로 통합하는 방식으로 구축은 단순하나 데이터 통제관리 및 성능에 문제가 존재할 수 있습니다. Centralized Style(중앙집중형) 구축 방식은 물리적으로 데이터를 통합하는 방식이며 중앙 허브에만 데이터가 존재합니다. Coexistence Style(분산형)은 중앙허브와 개별시스템에 데이터가 상호 존재하는 방식 입니다. 4가지 구축 유형 중 자주 사용되고 있는 중앙 집중형 구축 방식과, 분산형 구축에 대해서 좀 더 알아 보도록 하겠습니다.

중앙 집중형(Centralized Style) 구축 방식은 데이터 통합하는 관점에서 마스터 데이터를 통합하고 개별 업무에서 하나의 통합된 정보를 접근하는 방식으로 단일 시스템 내부에 개별 업무가 분할되어 있는 경우에 적합한 방식입니다. 반면에 분산형(Coexistence Style)은 구축 방식은 기준정보를 복제하여 개별 시스템에 존재하는 방식으로 개별 시스템이 시스템별로 업무가 분리되어 있는 경우 적합한 방식이라고 할 수 있습니다. MDM 솔루션은 대부분 중앙형 보다 분산형 구축방식으로 운영되고 있습니다. 기업 데이터, 업무 및 시스템 상황을 고려하여 적합한 구축방식을 선정하는 것이 바람 직 합니다.

[표-4] Centralized Style 과 Coexistence Style 구축 비교

column_img_3271.jpg



4. 마스터데이터 관리 솔루션 기능

솔루션 구축 방식이 선정되었다면 다음으로는 기준정보를 관리하는 MDM 솔루션 기반의 분산형 구축방식의 기능 중심으로 알아 보도록 하겠습니다.

[표-5] 마스터데이터 관리 솔루션 기능

column_img_3272.jpg

MDM 솔루션은 기능에 핵심 기능은 기준정보 통합관리하기 위한 기준정보의 등록관리, 데이터의 흐름 통제관리, 데이터의 동기화 관리, 지속적인 데이터의 품질관리를 하는 것이 핵심기능이라 할 수 있으며 그 중 가장 중요한 요소는 데이터 품질을 지속적을 모니터링하고 관리하는 것이라고 할 수 있습니다.



5. 마스터데이터 구축 활용

[표-6] 기준정보 정보 활용

column_img_3273.jpg

최근획하고 있습니다. 국가 기준정보가 구축이 된다면 데이터를 관리하기 위한 데이터 관리 비용이 현저하게 줄어들 것으로 판단되며 국민에게 정확한 정보를 제공하고, 행정업무 효율성 증대와 서비스 일관성 확보가 될 것으로 예상 됩니다. 그러나 아직 산재된 기준정보 중 어떤 데이터를 기준으로 통합 할 것인지, 품질의 이슈를 어떻게 해결할 것인지, 데이터 표준 및 관리체계를 어떻게 할 것인지 대한 해결과제가 많이 남아 있습니다.

[ 참고 문헌 ]
[1] 국가마스터데이터 지정 및 관리체계 구축 ISP(행정안전부)



출처 : 한국데이터진흥원

제공 : 데이터 전문가 지식포털 DBguide.net