DA 가이드

DA, SQL, DB보안 등 실무자를 위한 위한 DB기술 바이블!

데이터 표준화 원칙 정의

데이터 표준화
데이터 표준 수립
데이터 표준화 원칙 정의
작성자
admin
작성일
2021-02-10 13:58
조회
8170

데이터 표준화 요구 사항 수집

현업 및 개발자로부터 데이터 표준과 관련된 요구 사항을 인터뷰 및 설문조사 등을 통하여 조사함으로써 전사 데이터 표준 대상 후보를 식별하고 개선점을 도출하는데 사용할 자료를 마련한다. 조사시 현업 및 개발자들이 각자 맡고 있는 담당 영역의 틀에서 벗어나 반드시 전체적인 관점 및 제3자의 관점에서 기술할 수 있도록 유도한다.


  • 데이터 표준과 관련된 문제점을 조사할 때 유효한 방법 중 하나는 자신이 맡고 있는 영역과 다른 영역간의 인터페이스 부분에서 발생하는 불편 사항 및 개선 사항을 파악하는 것이다. 영역이라는 것은 주제 영역간 또는 정보 시스템간 일 수 있다.
  • 특정 영역에 대한 데이터 표준 요구 사항을 조사할 때 해당 영역을 오랫동안 관리하여 온 담당자보다는 해당 영역에 대해 익숙치 않은 관련자의 관점이 오히려 더 유용하다. 담당자는 자기가 담당하고 있는 영역에 대해 이미 익숙해져 있기 때문에 데이터 표준에 대한 필요성을 많이 느끼지 못할수 있다.

[그림 3-2-1] 표준화 요구 사항 정의서 예


현행 데이터 표준 원칙 분석

현행 정보시스템에서 적용하고 있는 데이터 표준 원칙 및 데이터 표준을 수집하고, 수집된 자료를 통하여 식별된 데이터 표준의 관리 대상 및 현황을 파악한다.


현행 데이터 표준 원칙 수집

현행 정보시스템에 적용되고 있는 데이터 표준에 대한 원칙을 수집한다. 현행 데이터 표준 원칙은 다음의 방법들을 통하여 수집한다.


현 정보시스템 개발 지침 문서 및 데이터 표준의 확보

현행 데이터 표준 원칙은 기존 정보시스템을 개발할 당시 작성하고 적용되었던 개발 지침 문서 및 데이터 표준을 통하여 수집한다. 데이터 표준 개발 지침 문서로는 각종 오브젝트(테이블, 칼럼 등)에 대한 명명규칙 등이 있다. 또한 실제 정의된 데이터 표준에 대한 검토를 통해서도 각 데이터 표준 대상별 관리 항목을 파악할 수도 있다.


현행 정보시스템 모델의 분석

현행 데이터 모델 또는 데이터베이스 스키마에서 보여지는 오브젝트의 정의 패턴 분석을 통하여 정보시스템 구축시 적용했던 원칙을 유추해 낼 수 있다. 그러나 유추해 낼 수 있는 데이터 표준 대상 및 관리 항목이 상당히 제한적이다.


데이터 표준 원칙 사용 현황 분석

수집된 데이터 표준 원칙 자료를 토대로 현행 정보시스템에서 적용하고 있는 데이터 표준 대상 및 관리 항목을 도출한다. 데이터 표준 대상별로 어떠한 정보시스템에 적용하고 있는지, 어떠한 관리 항목을 관리하는지, 어떻게 상이하게 관리되고 있는지에 대해 조사한다. 이를 통해 향후 전사 데이터 표준 대상에 대한 개선점을 도출하는데 사용할 자료를 마련한다.

[그림 3-2-2] 현행 데이터 표준 사용 현황 명세서 예


데이터 표준 개선 방안 정의

현행 데이터 표준 사용 현황 명세서와 표준화 요구 사항 정의서를 토대로 하여 데이터 표준 대상별 문제점 및 개선 방안을 도출한다. 문제점 및 개선 방안 도출시 반드시 전사적인 관점에서 접근하며, 전사적 관리의 필요성을 검토하여 관련 데이터 표준 대상 또는 대상별 관리 항목을 신규로 정의하거나 정의 대상에서 제외한다. 또한 최종적으로 데이터 표준 개선 방안은 기존에 수립된 데이터 관리 정책에 부합되어야 한다.

[그림 3-2-3] 데이터 표준 개선 방안 정의서 예


데이터 표준 원칙 수립

현행 데이터 표준에 대한 개선 방안을 토대로 향후에 적용할 전사 데이터 표준 기본 원칙을 정의하고, 향후 전사 데이터 표준의 생성 및 변경시 참고할 수 있도록 각 데이터 표준 대상별 데이터 표준 원칙을 작성하여 문서화한다.


데이터 표준 기본 원칙 정의

데이터 표준 개선 방안을 참고하여 전체적으로 적용할 기본 원칙을 수립함으로써 표준화에 대한 방향을 사전에 정의할 수 있다. 표준화 원칙의 예로는 한글명에 특수 기호를 사용하지 않거나, 영문명 표기시 발음되는 대로 기술하는 것을 금지하거나, 이음동의어 사용을 금지하는 것을 정의하는 것이다.

[그림 3-2-4] 표준화 원칙 정의서 예


데이터 표준 지침 작성

모든 사용자들이 참고해야 하는 데이터 표준화에 대한 구체적인 지침 문서를 작성한다. 각 데이터 표준 대상에 대한 세부 지침 사항은 데이터 표준 기본 원칙에 부합되도록 작성한다.


1) 데이터 표준 지침의 기본 구성

데이터 표준 지침은 데이터 표준 대상별로 어떻게 표준화할 것인가에 대해 구체적으로 정의한 문 서이다. 일반적으로 데이터 표준 지침에 포함될 내용들은 다음과 같다.



개요

데이터 표준화 및 데이터 표준 지침에 대한 목적을 기술한다.



데이터 표준화 관련자의 역할과 책임

데이터 표준화와 관련된 사용자들을 정의하고 그들의 역할 및 책임을 규정한다. 일반적으로 정의 하는 관련자로는 전사 데이터 관리자, 데이터 관리자, 모델러 등이 있다



데이터 표준 관리 절차

데이터 표준과 관련된 일련의 작업 프로세스를 규정하고, 프로세스별로 데이터 표준화 관련자들의역할을 기술한다. 일반적으로 데이터 표준 관리 절차로는 데이터 표준 정의, 데이터 표준 변경, 데이터 표준 준수 프로세스가 있다.



데이터 표준 기본 원칙

데이터 표준 대상 모두에 대해 일반적으로 적용되어지는 기본 원칙을 기술한다.



데이터 표준 대상별 명명규칙

데이터 표준 대상별로 데이터 표준 명칭을 작성하는 방법에 대해 구체적으로 기술한다. 데이터 표 준 대상별로 차이는 있으나, 일반적으로 명명 규칙은 [표 3-2-1]의 내용들을 포함한다.


[표 3-2-1] 데이터 표준 대상별 명명규칙


기술 내용 설명
사용 문자 알파벳, 한글, 숫자, 특수문자, 전각/반각 등의 허용 여부 또는 사용 조건을 규정한다.
영문 대소문자 알파벳을 사용할 경우 대소문자 사용과 관련한 규칙을 규정한다.
한글명과 영문명 동시 정의 여부 DBMS에 반영되는 객체들은 대부분 알파벳으로 정의하도록 되어 있는 경 우가 있기 때문에 이와 관련된 데이터 표준 정의 대상에 대해서는 한글명과 영문명의 정의가 필요하다. 일반적으로 표준 단어, 표준 용어가 이에 해당 한다.
명칭의 구조 표준 용어를 사용하는 테이블명 및 칼럼명의 경우 명칭을 통하여 그 특성 또는 부가 정보를 표시할 수 있도록 명칭에 대한 단어 표준 조합 구조를 명시한다. 예) 수식어 + [수식어] + 속성 유형(금액, 건수, 코드 등)
명칭에 대한 허용 길이 표준 용어를 사용하는 테이블명 및 칼럼명의 경우 DBMS의 물리적 특성으 로 길이의 제약을 받기 때문에 표준 용어의 허용 길이를 명시해야 한다.
명칭 표준화에 대한 기준 유사한 개념의 단어/용어가 복수 개 존재할 경우 어떤 기준으로 표준 단어/ 표준 용어로 선택할 것인가를 결정하는 기준을 정의한다. 예) 일련번호, ID, SEQ --> ID로 표준화한다.
명칭에 대한 예 명칭에 대한 허용 길이, 명칭 구조 체계, 명칭 표준화 기준 등을 준수하여 작성된 샘플을 몇 가지 명시한다.

데이터 형식 정의에 대한 기준


데이터 표현 형태를 정의하는 기준 및 방법을 기술한다. 일반적으로 표준 용어를 칼럼으로 사용하 는 경우나 표준 도메인, 표준 코드에 대하여 데이터 형식 정의에 대한 기준을 정의한다. 표준 용어 의 명칭에 대한 표준화 기준을 정의할 때 데이터 형식도 같이 정의함으로써 명칭의 결정과 동시에 데이터 형식도 자동적으로 결정된다.

- 예1) 표준 용어의 경우: ID에 대한 데이터 형식은 8자리 텍스트로 한다.

- 예2) 표준 도메인의 경우:‘ 번호’성 도메인에 대한 데이터 형식은 텍스트로 정의한다.




기타

데이터 표준 대상별로 고유한 특성에 대해 원칙을 구체적으로 기술한다.

- 예) 표준 도메인의 경우 데이터 타입을 결정하는 기준



2) 주요 데이터 표준 대상별 지침의 일반적인 구성

데이터 표준 대상에 대한 세부 지침은 각 데이터 표준 대상의 특성에 맞게 기술한다. 다음은 관련 데이터 표준 대상별로 일반적으로 기술하는 지침의 내용이다.



표준 단어

- 한글명 및 영문명에 대한 알파벳, 한글, 숫자, 특수문자, 전각/반각 등의 허용 여부 또는 사용조건

- 대소문자 사용 규칙

- 한글명, 영문명에 대한 허용 길이

- 합성어(단어의 조합으로 이루어진 단어) 정의에 대한 지침

- 접두사에 대한 처리 방안

- 동음이의어/이음동의어 허용 여부 및 처리 방안



표준 용어

- 데이터 명칭에 대한 구조 체계

- 한글명, 영문명에 대한 허용 길이

- 용어를 테이블이나 칼럼명으로 사용할 경우 준수해야 할 특이한 명명규칙

- 용어를 칼럼명으로 사용할 경우 데이터 형식 표준화에 대한 기준 및 표준 도메인 적용 여부



표준 도메인

- 데이터 형식 표준화에 대한 기준



표준 코드

- 데이터 명칭에 대한 구조 체계 및 명명에 대한 기준

- 데이터 형식 표준화에 대한 기준

- 코드번호 체계 정의에 대한 규칙


3) 데이터 표준 개발 지침 작성 시 유의사항

일반적으로 데이터 표준 지침은 현행 데이터 표준 지침을 그대로 유지하는 것이 가장 바람직하지만, 무엇보다도 단위 정보시스템의 영역을 벗어나 다른 정보시스템에서도 적용이 가능하도록 범용성을 고려하여 정의한다.


  • DBMS마다 허용하는 테이블 및 칼럼의 물리명 길이가 상이하다. 따라서 용어에 대한 영문명의 허용 길이에 대한 지침을 정의할 때 적용대상 DBMS에 모두 적용이 가능하도록 고려해야 하며, 어려울 경우 영문 축약명을 추가로 정의하거나 뷰(View)를 사용하는 등 다른 대안을 마련한다.
  • DBMS마다 정의하고 있는 데이터 타입이 각기 상이하기 때문에 특정 DBMS 기준으로 데이터 형식을 정의할 경우 다른 DBMS에서는 다른 데이터 타입으로 적용되는 경우가 발생한다. 따라서 표준 용어 또는 표준 도메인에 서로 다른 DBMS에 따라 어떻게 적용할 것인가에 대한 방안을 고려해야 한다.

    - 방안1) 데이터 형식을‘문자 1자리’, ‘숫자 15.2자리’등 논리적으로 기술하는 것으로 지침을 내리고, 이러한 논리적인 데이터 형식과 각 DBMS별 물리적인 데이터 타입 간의 변환 Map을 정의한다.

    - 방안2) 데이터 형식의 정의시 특정 DBMS 기준의 데이터 타입을 이용하여 정의하고, 기준이 되는 DBMS의 데이터 타입과 기타 DBMS의 데이터 타입 간의 변환 Map을 정의하여 다른 DBMS에 적용할 때 데이터 타입 결정에 대한 기준을 제공한다.