데이터이야기

DB 노하우, 데이터직무, 다양한 인터뷰를 만나보세요.

빅데이터 세상에서 영향력있는 데이터 만들기 : 데이터 거버넌스

데이터 이야기
작성자
dataonair
작성일
2018-10-15 00:00
조회
7857


빅데이터 세상에서 영향력있는 데이터 만들기 : 데이터 거버넌스



1. 서론

오늘날 많은 국가와 기업이 추진하고 있는 '디지털 트랜스포메이션'의 중심에 데이터가 자리하고 있습니다. 데이터 중심 혁신(Data Driven Innovation)을 외치고, 데이터가 자본이 되는 데이터 캐피탈리즘이 대두되고 있는 데이터 혁명의 시대라 할 수 있습니다.
세계 주요국가들은 빅데이터를 원동력으로 4차 산업혁명을 추진하고 있으며, 다양한 분야에서의 데이터 활용을 극대화하기 위해 데이터 경쟁력 강화를 핵심 전략으로 삼고 있습니다. 실제로 미국, 영국, 독일 등 선진국에서는 공공 데이터를 민간부문에 적극적으로 개방하고 있고, 금융, 의료, 제조, 통신분야 등의 민간분야에서도 글로벌 인터넷 기업을 중심으로 빅데이터와 인공지능 기술을 연계하여 민간 산업 경쟁력을 혁신적으로 고도화하기 위한 노력을 기울이고 있습니다.

이처럼 데이터의 중요성이 강조되는 빅데이터 시대의 경쟁력 강화를 위해서는 활용 가능한 양질의 데이터 확보, 산업 활성화를 위한 빅데이터 플랫폼과 생태계 구축, 전문인력을 양성하는 노력이 필요합니다. 또한, 빅데이터 인프라 환경 구축과 더불어 보다 가치 있고 영향력 있는 데이터를 만들고 관리하기 위한 데이터 거버넌스 체계를 구축하는 것 역시 데이터 활용 경쟁력 강화의 중요한 요건이 됩니다.


본 고에서는 데이터 거버넌스에 대한 개념을 이해하고, 빅데이터 시대에 왜 데이터 거버넌스가 주목받아야 하는지, 빅데이터에 적합한 데이터 거버넌스는 무엇을 고려해야 하는지에 대해 알아보고자 합니다.



2. 데이터 영향력 강화를 위한 데이터 거버넌스의 중요성 2.1 데이터 거버넌스의 이해

데이터 거버넌스란 기업에서 보유하고 있는 데이터의 관리정책, 지침, 표준, 전략 및 방향을 수립하고, 데이터를 관리할 수 있는 조직 및 서비스를 구축하는 정책과 프로세스 관점에서의 IT 관리체계를 의미합니다. 이는 효과적인 데이터 사용을 위해 반복적이고 확장 가능하도록 조직의 데이터 관리활동을 수행하는 것을 말하며, 관리체계 기반 하에 데이터 품질관리, 메타데이터 관리, 마스터데이터 관리, 프라이버시 관리, 데이터 수명주기관리 등을 포함하는 체계입니다.


데이터 거버넌스를 구축하는 목적은 데이터로 인한 리스크를 미리 예측하여 대비하고, 데이터 활용도 증대를 통해 가치를 향상시켜 지속적으로 비즈니스 목적에 부합하는 서비스를 제공하고, 데이터 관리비용을 효율적으로 절감하는데 있습니다. 아직 데이터 거버넌스 공식 표준이 확정되지 않았지만, 조직의 데이터 관리가 효과적으로 이루어지도록 평가(Evaluation), 감독(Direction), 모니터링(Monitoring)하는 체계 중심으로 표준화가 진행중입니다.

2.2데이터 관리 기능 및 데이터 관리 프레임워크

[그림 1]과 [그림 2]는 데이터 거버넌스와 관련된 관리기능과 프레임워크를 보여주고 있습니다.


데이터 관리 기능 및 데이터 관리 프레임워크

데이터 관리 기능은 다양한 세부업무들로 구성되며, 세부업무들의 구성 및 세부업무들간의 유기적 연계를 통해 거버넌스를 구현하게 됩니다.
빅데이터 시대를 맞이하여 기존의 데이터 거버넌스 및 관리 기능이 더욱 강화되고 확장되고 있습니다. 그렇다면 빅데이터 시대에서의 데이터 거버넌스는 어떤 모습이어야 하는지 알아보도록 하겠습니다.



3. 빅데이터 세상에서의 데이터 거버넌스

3.1 빅데이터 거버넌스의 실현


빅데이터 시대가 되며 웹/소셜미디어/IoT/바이오 데이터 등 다양한 정형/비정형 데이터가 생성되고 있으며, 빅데이터 분석의 도입에 발맞추어 데이터 거버넌스의 중요성이 더욱 강조되는 상황입니다.
조직 내 빅데이터 거버넌스가 확립되지 못하면 대규모 데이터 분석결과를 활용한 중요한 의사결정에 품질이 낮은 데이터를 사용함으로써 오류를 유발할 수 있고, 비정형 프라이버시 데이터 관리 미흡으로 인한 개인 정보유출 위험, 폭증하는 데이터의 수명관리 소홀로 인한 IT비용 증가 등의 위험을 초래할 가능성이 더욱 커지게 됩니다. 이러한 빅데이터 환경에서의 리스크를 제거하기 위해서는 기존 데이터 거버넌스보다 확장된 데이터 거버넌스의 구축으로 효과적인 데이터 관리체계를 실현할 필요가 있습니다.


[그림3] 빅데이터 거버넌스 아키텍쳐

[그림 3]에서와 같이 빅데이터 수집/저장/분석/시각화 등 빅데이터 전체 수명주기에 거버넌스 체계를 포함한 데이터 관리/통제환경을 구성해야하며, 빅데이터 거버넌스는 기존의 거버넌스에 빅데이터 특성을 고려한 확장이 필요합니다.


3.2 빅데이터 거버넌스 체계 실현을 위한 고려사항


빅데이터의 특성인 볼륨, 속도, 다양성의 증가로 인해 효율적인 데이터 관리의 필요성이 더욱 중요하게 인식되고 있으며, 빅데이터 분석의 결과를 중요한 의사결정에 활용하고 있습니다. 이러한 빅데이터 환경에서는 기존의 거버넌스 영역에서 다음의 추가적인 고려사항이 발생합니다.
첫째로, 비정형 데이터, 외부/공유 데이터에 대한 거버넌스 정책과 분석을 지속적으로 수행할 수 있는 분석 조직에 대한 거버넌스 정책이 필요하며, 둘째로, 빅데이터를 분석에 적용하고 업무에 활용하는 프로세스에 대한 거버넌스 체계 또한 필요합니다. 이를 데이터 거버넌스 구성요소 관점으로 세분화하여 정리하면 [표1]과 같습니다.


column_img_3574.jpg

빅데이터 플랫폼, 생태계의 구축과 더불어 보다 영향력 있는 데이터를 만들기 위해서는 [표 1] 에서와 같이 데이터의 품질보장, 프라이버시 보호, 데이터 수명관리, 전담조직과 규정정립, 데이터 소유권 명확화, 데이터 계보관리 등을 통하여 빅데이터 또는 빅데이터 분석결과가 적시에 필요한 사람에게 제공되도록 빅데이터 거버넌스 체계를 확립해야 합니다.

Organization 관점에서, 데이터 분석가/데이터 사이언티스트의 등장에 따른 조직/역할 정의가 필요하고, 빅데이터 생태계 안에서 지속적으로 생성되고, 가공되고, 변형되는 데이터의 소유권 및 책임을 정의해야 합니다. 데이터 품질 관점에서는 빅데이터의 특성 상 구조화되지 않은 비정형 데이터, 실시간 Streaming 데이터, 외부로부터의 수집데이터 등 품질 보장이 어려운 특성을 가지는 데이터가 존재하며 이러한 상황에서 어떤 수준으로 데이터 품질을 관리하고 어떻게 품질을 측정할 것인지, 어떻게 데이터의 진위여부를 판단할 것인지 등을 고려해야 합니다. 또한 다양한 유형, 다양한 소스 데이터 출현으로 메타정보도 이러한 특성을 반영한 관리가 필요하며, 빅데이터에 포함된 민감 정보도 보호할 수 있는 기술적, 제도적 안전장치도 마련해야 합니다.


또한 대규모 데이터 관리에 투입되는 IT자원을 효율적으로 활용하기에 적합한 데이터의 보관 및 폐기 정책도 수립하여야 합니다. 업무가 복잡해지고 시스템간 연계가 늘어나면서 데이터가 어떻게 생성됐고, 어떤 과정을 거쳤으며, 어디에 쓰이고 있는지 등의 현황을 파악하고자 하는 니즈로 데이터 리니지(데이터 계보) 관리가 주목받고 있는 것도 같은 맥락이라 할 수 있습니다.



4. 맺음말

빅데이터가 활성화 될수록 사용하는 데이터 소스가 다양해지고, 비정형 데이터 유형도 증가하며, 데이터의 생성과 분석, 활용주기도 빨리지게 될 것입니다. 또한 빅데이터 활용분야도 점차 확대되어 전체 산업영역이 상호 연계되고 연결될 것입니다.
이렇게 4차 산업혁명 시대의 중심에서 빅데이터 활용이 강조될수록 기업의 경쟁력 향상과 전략적 목표 달성을 위해 고품질 데이터의 확보 및 유지가 무엇보다 중요합니다. 매일 새롭게 생성되는 데이터들로 넘쳐나는 빅데이터 시대에서는 기업의 데이터 품질과 관리 수준이 그 기업의 경쟁력과 시장 지배력을 결정하는 척도가 될 것입니다.

실시간으로 발생하는 빅데이터의 분석 결과로부터 미래에 대한 예측과 통찰력을 얻고, 중요한 의사결정에 활용하기 위해서는 데이터의 품질보장, 프라이버시 보호, 데이터 수명관리,데이터 소유권의 명확화 등의 거버넌스체계 강화가 함께 이루어져야 합니다. 빅데이터가 중요한 의사결정에 사용될수록 더 큰 리스크를 가질 수 밖에 없으며, 이러한 리스크는 데이터 거버넌스를 통해서 적절하게 관리될 수 있을 것이기 때문입니다. 빅데이터 생태계에서 영향력있는 데이터를 확보하고 유지하고, 이를 통해 데이터를 조직의 중요한 자산으로 관리하기 위해서 데이터 거버넌스가 필요한 시점입니다.



[참고문헌]
4차 산업혁명 시대의 데이터 거버넌스 개선 방향 (2018, 정보통신정책연구원)
KISTEP 기술동향브리프-빅데이터 (2018, 한국과학기술기획평가원)
빅데이터 시대와 데이터 융합 (2018, 정보통신정책연구원)
빅데이터 활성화를 위한 거버넌스의 역할과 지원 (2017, 조완섭)
2017 데이터산업 백서 (2017, 한국데이터진흥원)
포괄적인 데이터 거버넌스 : 경쟁 우위를 위한 프레임워크 (2015, Informatica)
Data Governance Framework for BigData Implementation with a Case of Korea
(2017, IEEE International Congress on BigData, Hee Young Kim, June-Suh Cho)
[참고사이트]
www.kdata.or.kr한국데이터진흥원[참고관련기사]
http://www.ciokorea.com/news/37617
http://www.ciokorea.com/news/37199page=0,1
http://www.ddaily.co.kr/news/article.htmlno=171841
http://www.comworld.co.kr/news/articleView.htmlidxno=49230
http://www.dator.co.kr/bmonthly/407482http://www.newstomato.com/ReadNews.aspxno=778465
https://standards.ieee.org/industry-connections/BDGMM-index.html
https://tdwi.org/articles/2017/04/14/adapting-data-governance-to-big-data.aspx
https://tdwi.org/articles/2017/09/15/diq-all-data-governance-in-big-data-world.aspx [참고도서]
“빅데이터 거버넌스 : 빅데이터 활용의 전제조건”, 홍릉과학출판사, 조완섭 , 우준식, 신정길, 조재용, 김상하, 주재은 지음
“데이터 분석 전문가 가이드”, 한국데이터진흥원



출처 : 한국데이터진흥원

제공 : 데이터 전문가 지식포털 DBguide.net