DA 가이드

DA, SQL, DB보안 등 실무자를 위한 위한 DB기술 바이블!

데이터 표준화 개념

데이터 표준화
데이터 표준화 개요
데이터 표준화 개념
작성자
admin
작성일
2021-02-10 13:54
조회
25111

데이터 표준화 정의

데이터 표준화는 시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 것을 의미한다. 이러한 데이터 표준화 작업은 데이터의 정확한 의미를 파악할 수 있게 할 뿐만 아니라 데이터에 대한 상반된 시각을 조정하는 역할을 수행한다.

[그림 3-1-1] 데이터 표준화 의미


데이터 명칭

데이터 명칭은 해당 기업 내에서 데이터를 유일하게 구별해주는 이름이다. 따라서 데이터 명칭에 대한 표준화는 동음이의어 및 이음동의어의 조정을 필요로 한다. 데이터 명칭은 일반적으로 다음의 원칙에 부합되어야 한다.


유일성

데이터 명칭은 해당 개념을 유일하게 구분해 주는 이름이어야 한다. 하나의 개념에 대해 모든 사용자들이 통일된 용어를 사용할 수 있도록 오직 하나의 명칭만을 허용해야 한다.

예1) 고객 계좌번호, 고객 구좌번호 -> ‘고객 계좌번호’로 통일
예2) EMAIL 주소, EMAIL -> ‘EMAIL 주소’로 통일


업무적 관점의 보편성

데이터 명칭은 업무적 관점에서 보편적으로 인지되는 이름이어야 한다. 일반적으로 기업 또는 조직 내의 구성원들이 해당 개념을 지칭할 때 가장 많이 사용하는 업무 용어를 그대로 사용하는 것이바람직하다.


의미 전달의 충분성

데이터 명칭은 그 이름만으로 데이터의 의미 및 범위가 파악될 수 있어야 한다. 업무나 사용자의 관점에 따라 의미가 달라질 수 있는 이름은 수식어 등을 사용함으로써 구체화하는 것이 좋다.


데이터 정의

데이터 정의는 해당 데이터가 의미하는 범위 및 자격 요건을 규정한다. 사용자가 데이터의 의미를 가장 잘 이해할 수 있도록 업무 관점에서 범위와 자격 요건을 명시해야 하고, 데이터 명칭만으로는 사용자에게 전달하기 어려운 기타 사항들을 전달하는 역할을 한다. 또한 데이터 정의는 데이터 소유자를 결정하는 기준이 된다. 데이터 정의를 기술할 경우 다음의 사항들을 고려한다.


  • 데이터 사용자가 데이터의 의미를 잘 이해할 수 있도록 관련 업무를 모르는 제 3자의 입장에서 기술한다.
  • 서술식 정의만으로 데이터의 의미 전달이 어려울 경우에 실제 발생할 수 있는 데이터의 값도 같이 기술한다.
  • 데이터 명칭을 그대로 서술하거나 약어 또는 전문 용어를 이용한 정의 기술은 가급적 사용하지 않는다.
데이터 형식

데이터 형식은 데이터 표현 형태의 정의를 통해 데이터 입력 오류와 통제 위험을 최소화하는 역할을 한다. 데이터 형식은 업무 규칙 및 사용 목적과 일관되도록 정의한다.


데이터 타입
  • Numeric
  • Text
  • Date
  • Char
  • Timestamp 등

데이터 길이 및 소수점 자리

데이터 형식을 정의할 경우에는 다음의 사항들을 고려한다.


  • 도메인을 정의하여 데이터 표준에 적용함으로써 성격이 유사한 데이터 간의 데이터 형식을 통일화 한다.
  • 데이터의 최대값 또는 최대 길이가 고정되어 있지 않을 경우 충분히 여유있게 정의한다.
  • 특수 데이터 타입(CLOB, Long Raw 등)은 데이터 조회, 백업, 이행 등에 있어서 제약 사항이 존재하는 경우가 많기 때문에 가급적 사용하지 않는다.
데이터 규칙

데이터 규칙은 발생 가능한 데이터 값을 사전에 정의함으로써 데이터의 입력 오류와 통제 위험을 최소화하는 역할을 한다. 데이터 규칙을 통해 데이터의 정합성 및 완전성을 향상할 수 있다. 데이터 규칙의 유형은 다음과 같다.


기본 값

사용자가 화면이나 프로그램으로부터 어떠한 값의 입력도 없는 경우 데이터 타입에 따라 미리 정의된 기본값이 입력될 수 있도록 한다. 즉 데이터 값의 입력을 생략했을 경우 자동으로 입력되는 데이터 값을 의미한다. 예를 들면, Numeric 타입의 항목에 대한 기본 값으로 ‘0’이 자동으로 입력되게 하거나 Char 타입의 항목에 대한 기본 값으로 ‘스페이스’가 자동으로 입력되게 한다.


허용 값

업무 규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 제한하는 것으로 표준 코드 중 데이터 항목별로 가질 수 있는 코드 값을 사전에 정의하는 경우가 이에 해당한다. 예를 들면 표준코드에 정의된 허용 값이 01,02,03,04...10과 같이 정의 되었으나 특정 데이터 항목에서 발생할 수 있는 허용 값은 01,03,05처럼 부분적인 값을 갖는 경우이다.


허용 범위

업무 규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 범위로 제한하는 경우이다. 예를 들면, 특정 데이터 항목에 허용 범위로 1~5까지를 정의한 경우 1~5 이외에는 입력이 불가능하도록 사전 에 제한할 수 있다.


데이터 표준화 구성요소

전사적인 데이터 표준화를 추진하기 위해 수립해야 할 표준화 구성요소는 데이터 표준, 데이터 관리 조직, 데이터 표준화 절차이다.

[그림 3-1-2] 데이터 표준화 구성 요소


데이터 표준

데이터 표준화는 기본적으로 데이터 모델 및 데이터베이스에서 정의할 수 있는 모든 오브젝트를 대상으로 하는 것이 수행하는 것이 이상적이나 주로 관리해야 될 필요성이 있는 오브젝트만을 대상으로 데이터 표준화를 하는 것이 효율적이다. 일반적으로 데이터 표준으로 관리되는 대상에는 용어, 단어, 도메인, 코드가 있다.


표준 용어

업무적으로 사용하는 용어에 대한 표준을 정의함으로써 용어 사용 및 적용에 대한 혼란을 방지하고 원활한 커뮤니케이션을 촉진시킨다. 표준 용어는 업무적 용어와 기술적 용어가 있다.



업무적 용어

흔히 일상 업무에서 사용하는 용어로서 보고서나 업무 매뉴얼상에서 많이 나타난다. 데이터 표준화 작업은 주로 데이터베이스에 적용하고 사용할 객체에 국한되기 때문에 업무적 용어의 표준화가 반드시 필요한 것은 아니다. 그러나 데이터베이스에서 적용할 용어들이 대부분 현업에 서 사용하는 용어를 그대로 수용한다는 점을 고려할 때 업무적 용어의 표준화는 데이터 표준화 작업을 수월하게 해주는 장점이 있다. 업무적 용어 표준화의 예는 색인(INDEX)을 들 수 있다.



기술적 용어

정보시스템에서 사용하는 용어를 지칭한다. 데이터 모델 또는 데이터베이스 스키마에서 나타나는 테이블명 및 칼럼명 등이 기술적 용어에 해당한다. 데이터 표준화 측면에서 용어를 표준화한다는 것은 업무적인 용어를 정보시스템에 반영하기 위해 기술적인 용어로 전환하고 이것을 일관되게 유지하고 관리한다는 것이다. 테이블 및 칼럼의 한글명은 대부분 업무적이터베이스의 제약 사항(테이블명의 중복 불허, 명칭에 대한 길이 제약)과 표준 단어의 사용에 따라 업무적 용어와는 상이하게 정의될 수도 있다.


표준 단어

표준 용어를 구성하는 단어에 대한 표준을 정의함으로써 용어에 대한 한글명과 영문명을 일관되게 정의할 수 있게 한다. 표준 단어의 목적은 2가지를 들 수 있다.


  • 표준 단어를 관리함으로써 동일한 개념을 의미하는 용어(또는 표준용어)의 생성을 예방한다. 예를 들어 ‘고객’과 ‘계좌’라는 표준단어를 정의함으로써 ‘고객 계좌’라는 용어만 표준으로 인정 하고 ‘고객 구좌’라는 용어는 표준에서 배제할 수 있다.
  • 표준용어의 영문명 작성 기준이 된다. 즉, 테이블 및 칼럼의 한글명만 작성하면 영문명은 표준 단어에 의해 자동으로 결정된다.
표준 도메인

표준 도메인은 칼럼에 대한 성질을 그룹핑한 개념이다. 도메인은 크게는 문자형, 숫자형, 일자형, 시간형으로 분류할 수 있고, 더 세부적으로는 명, 주소, ID(이상 문자형), 금액, 율, 수량(이상 숫자형) 등으로 분류할 수 있다.
도메인에 대한 표준을 정의함으로써 동일한 성질을 가진 칼럼의 데이터 타입 및 데이터 길이를 일관되게 관리할 수 있으며, 향후 칼럼 값에 대해 공통적인 데이터 검증 규칙의 적용이 가능하다. 표준 도메인을 칼럼에 적용함으로써 칼럼의 데이터 타입 및 데이터 길이를 일관되게 정의할 수 있다.


표준 코드

코드는 도메인의 한 유형으로서 특정 도메인 값(코드값)이 이미 정의되어 있는 도메인이다. 따라서 코드에 대한 표준은 다른 표준과는 달리 데이터 값, 즉 코드값까지 미리 정의해야 한다.


기타 데이터 표준 관련 요소

용어, 단어, 도메인 및 코드 등 일반적으로 관리하는 데이터 표준 이외에도 필요에 따라서 데이터 모델에서 정의하는 주제영역, 관계명과 데이터베이스에서 정의하는 데이터베이스, 데이터베이스 스키마, TABLESPACE, INDEX, CONSTRAINT 등에 대한 표준을 관리한다.


데이터 표준 관리 조직

전사적으로 수립된 데이터 표준 원칙, 데이터 표준, 데이터 표준 준수 여부 관리 등을 위해서는 데이터 관리자(DA, Data Administrator)의 역할이 요구된다. 데이터 관리자는 하나의 기업 또는 조직 내에서 데이터에 대한 정의, 체계화, 감독 및 보안 업무를 담당하는 관리자를 의미한다. 이러한 데이터 관리자는 기업 또는 조직 전반에 걸쳐 존재하는 데이터에 대한 관리를 총괄하고 정보 활용에 대한 중앙 집중적인 계획 수립 및 통제를 수행한다.


1) 데이터 관리자 주요 역할

데이터에 대한 정책과 표준 정의

데이터 관리자는 데이터에 대한 표준화 원칙 및 표준을 정의한다. 표준에 대한 변경과 추가가 발생시에 최종적으로 승인 의사결정을 수행하며, 기업 내에 산재된 시스템에 대한 데이터 표준 준수 여부를 주기적으로 체크하여 지속적인 표준 관리 활동을 수행한다.



부서간 데이터 구조 조율

데이터 관리자는 전사 데이터 관리 기준에 의거하여 단위 시스템이나 조직 부처에 명확한 데이터 관리 기준을 제시하고, 부서간에 데이터 구조에 대한 이견 발생시에 전사 데이터 관리 관점에서 데이터 구조를 제시하여 체계적인 데이터 구조 관리가 이루어지는 역할을 수행한다.



데이터 보안 관리

데이터 관리자는 데이터에 대한 보안 정책 수립, 보안 정책 준수 여부 체크, 보안 시정 조치 요구등을 수행한다.



데이터 모델 관리

데이터 관리자는 데이터에 대한 중요한 의사소통의 도구가 되는 데이터 모델을 물리적인 변경 시점에 동일하게 관리함으로써 향후 데이터 활용에 대한 업무 협의시 신속한 의사결정이 이루어지도록 관리한다.



데이터의 효율적인 활용 방안 계획

데이터 관리자는 데이터가 전사적으로 공유되어 효율적으로 활용되도록 지속적으로 데이터 활용상의 문제점 등을 체크하여 데이터 활용과 관련된 방안을 수립하여 시행한다.


2) 데이터 관리자 세부 역할

데이터 관리자는 다음과 같이 전사 데이터 관리자, 업무 데이터 관리자, 업무 시스템 데이터 관리 자로 나뉘어지고 각자의 역할은 [표 3-1-1]과 같다.

[표 3-1-1] 데이터 관리자 세부 역할


구분 주요 활동
전사 데이터 관리자 - 데이터 표준화에 대한 정책 결정
- 검토된 데이터 표준 제안에 대한 승인
업무 데이터 관리자 - 담당 업무 기능의 데이터 요구 사항 반영을 위해 필요한 데이터 표준 정의
- 업무 관련 데이터 표준 변경 제안에 대한 합동 검토
업무 시스템
데이터 관리자
- 시스템 관리 목적의 데이터 요구 사항을 위해 필요한 데이터 표준 정의
- 업무 관련 데이터 표준 변경 제안에 대한 합동 검토
- 데이터 모델에 대한 데이터 표준 적용 및 준수 여부 체크
3) 데이터베이스 관리자와 비교

데이터 관리자(DA, Data Administrator)와 데이터베이스 관리자(DBA, DataBase Administrator) 는 [표 3-1-2]와 같이 역할이 구분된다.

[표 3-1-2] 데이터 관리자/데이터베이스 관리자 역할 비교


구분 데이터 관리자(DA) 데이터베이스 관리자(DBA)
관리 대상 데이터 요구 사항을 반영한 데이터 모델 및 각종 표준 데이터 모델을 특정 데이터베이스 제품의 특성에 맞추어 구축한 데이터베이스
주업무 업무에 필요한 데이터의 메타 데이터를 정의하고 신규 또는 변경된 요구 사항을 신속하게 데이터 모델에 반영 요구되는 성능 수준을 발휘하면서 안정적 으로 운영되도록 데이터베이스를 관리
품질 수준 확보 데이터 표준의 관리 및 적용을 통해 품질 수준을 확보 데이터의 정합성 관리를 통해 데이터 품질 수준을 확보
전문 기술 담당 업무 분야에 대한 업무 지식과 데이 터 모델링에 대한 전문성이 필요 데이터 모델에 대한 해독 능력 및 특정 데 이터베이스 제품에 대한 전문 지식이 필요
데이터 표준화 절차

일반적인 데이터 표준화 절차는 데이터 표준화 요구 사항 수집, 데이터 표준 정의, 데이터 표준 확 정, 데이터 표준 관리로 이루어지며, 데이터 표준화 절차별 주요 활동은 [표 3-1-3]과 같다.

[표 3-1-3] 데이터 표준화 절차별 활동


구분 주요 활동
데이터 표준화
요구 사항수집
- 개별 시스템 데이터 표준 수집
- 데이터 표준화 요구 사항 수집
- 표준화 현황 진단
데이터 표준 정의 - 표준화 원칙
- 데이터 표준 정의 : 표준 용어, 표준 단어, 표준 도메인, 표준코드, 기타 표준
데이터 표준 확정 - 데이터 표준 검토 및 확정
- 데이터 표준 공표
데이터 표준 관리 - 데이터 표준 이행
- 데이터 표준 관리 절차 수립 : 데이터 표준 적용, 변경, 준수 검사 절차