전문가칼럼

DBMS, DB 구축 절차, 빅데이터 기술 칼럼, 사례연구 및 세미나 자료를 소개합니다.

다국어 지원 데이터베이스 (1) - 개념 및 Architecture

전문가칼럼
DBMS별 분류
Oracle
작성자
dataonair
작성일
2003-01-01 00:00
조회
9349





개념 및 Architecture

엔코아 정보 컨설팅의 지용


금번 연재부터는 급변하는 Business 환경의 변화로 인해 중요한 고객 채널의 일환이 되어 버린 인터넷을 Global Business에 효과적으로 활용하기 위한 ‘Multilingual Support Database’에 대해 알아보고자 한다. 본 회에서는 Business 환경의 변화, Globalization 필요성의 대두, 유니코드를 포함한 Multilingual Database의 기본적 개념, 기본 Architecture 등에 대해 논의하고 이후 3번의 연재에 걸쳐 세부적인 기술 요소에 대해 기술하고자 한다.

Business 환경의 변화

최근 몇 년간 전세계 온라인 시장에 대한 통계가 빠른 속도로 이동하고 있다. 한때 웹 사용자의 대다수를 차지했던 영어권 사용자들은 향후 3년 이내에 전체 웹 사용자의 30% 수준으로 떨어질 것으로 전망되고 있으며, 이러한 추세는 Business에 중요한 암시를 주고 있다. Global Business를 추진하는 기업에게 상거래 및 고객 관리를 위한 핵심 채널로 부각된 인터넷에 대한 효율적인 대응이 주요 Business 전략의 일환이 된 것이다.

오늘날 Global 경제에서 경쟁력 있는 기업으로 살아 남으려면 보다 효율적인 Global e-Business 전략을 세워야 할 것이다. 각 기업들이 Global e-Business를 지탱하기 위해서는 Target 고객에게 자신의 것이 아닌 그들의 언어와 문화로 접근하여야 한다. 효율적인 Globalization은 ‘새로운 시장 개척’, ‘웹사이트의 외국인 방문 증가’, ‘고객지원의 비용 및 시간 절약’, ‘고객만족도 증대’ 등을 통해 해당 기업의 가치를 공고히 하는데 일조할 것이다. 즉, 기업의 e-Brand를 세계의 e-Brand로 성장시키는 필수 과정이라 할 것이다. 구체적인 통계치를 제시하지 않더라도 점증하는 인터넷 사용자수 및 전자상거래의 비중과 중요성에 대해 이의를 제기할 사람은 많지 않을 것으로 보인다. 이제 Globalization에 대한 개념과 기본사항에 대해서 보다 자세히 알아보기로 한다.

기본적 의미의 Globalization이란 서로 다른 지역에서의 일상적인 생활조차도 멀리 떨어진 곳에서 일어난 일들에 의해 영향을 받게 되고, 삶의 관계가 전세계적으로 동일한 차원에서 심화되고 있는 현상을 말한다. 즉 사람들의 삶이 공간적 차이를 넘어 시간적으로 일치되는 연대성을 이루는 것이다. IT 시각의 협의의 Globalization이란 현대의 정보 통신 기술을 사용하여 전세계를 하나의 네트워크로 연결하여 서로 다른 시간과 공간에 있는 사람에게 동일성을 부여하여 그들 생활중의 일부분을 동일한 차원에서 보고 느끼도록 하나의 통합된 시스템을 구축하는 것이다.

I18N (Internationalization)

세계 각국에서 사용하고 있는 문자는 오랜 역사를 거쳐 각기 언어의 독특한 특성을 갖게 되었다. 이러한 각 언어의 특성은 컴퓨터의 환경으로 표출하기 위해 많은 어려움을 겪으며 발전해 왔으며, 각 언어의 특성은 컴퓨터 내부적으로 다른 형태의 표현방식으로 나타나게 된 것이다. 이러한 다른 형태의 표현 방식은 Globalization을 추진하는데 커다란 장애로 자리잡게 되었다. 바로 이러한 장애를 극복할 수 있는 것이 Internationalization으로서, ASCII 코드와 유사한 Encoding scheme이 가진 제약성(7~8 비트만 사용하기 때문에 표현할 수 있는 문자의 수가 제한됨.)을 Unicode(16 비트를 사용하고 있어 한국어나 일본어 같은 언어를 디스플레이 하기에 충분한 65,536 개의 문자를 표현할 수 있게 만들어 짐.)라고 하는 새로운 Encoding 시스템을 사용하여 극복할 수 있게 되었다. 따라서, 국가와 문화에 따라 달라지는 요소들을 규명하고 분리하여 방문자의 문화적 선호를 기반으로 하는 적절한 정보로 대체할 수 있게 해야 하는 것이다. 그 외 매개변수(언어, 필기방식, 통화, 도량형, 시간대, 지리적 요소)를 Localization이 용이하도록 하기 위해 개선하고 디자인하는 작업이 Internationalization의 한 과정이다.

Contents와 환경을 특정한 언어와 문화, 지역에 맞게 조율해나가는 과정을 말한다. 단순히 Contents를 번역하는 일은 상대적으로 쉬운 일이나, 특정 수요자를 위해 얼마만큼 지역 특성에 맞는 Contents를 구성해야 하는 지도 결정해야 하는데 이는 매우 중요한 Localization 전략이다. 하지만 언어적, 문화적 장애를 넘어 해당 기업의 본질적인 기본 이미지와 메시지는 일관되게 유지되어야 한다.

Globalization을 위해서는 통합된 Back-end system을 설계하여야 한다. 만일 고객 Channel을 통해 중국어나 일본어, 아랍어로 주문이 들어왔는데 사용하고 있는 실행용 데이터베이스가 각 국가의 문자를 읽을 수 없다면 사업 성과를 거둘 수 없을 것이다. 즉, 모든 Server, Database, Language와 각종 Tool을 평가해야 한다. 웹사이트가 웹 브라우저로부터 사용자의 언어를 찾아내거나 사용자에게 언어를 선택하도록 요청할 수 있어야 하며, 사용자가 원하는 지역을 지적하고 나면 자동적으로 어떠한 오류 없이 원하는 언어와 데이터, 통화 그리고 각종 카테고리들이 수행되어야 한다.

Multilingual Support Database의 기본 Architecture

IT와 관련된 장비와 S/W가 영어권 국가를 중심으로 개발됨에 따라 지역별 언어지원이 항상 문제가 되어 왔으며, CJK로 대변되는 Wide-Character 국가들은 별개의 Character 체계를 갖춘 시스템으로 Customizing 되어 왔다. 점차 굴뚝 산업에서 e-Business 체제로의 변혁이 이루어지면서 점차 산업의 방향과 시장성이 Global化 되었으나, 개별 언어 중심적 Character 체계는 장애요인으로 인식되어 왔다. 만약, 여러 국가를 대상으로 하는 전자상거래 사업을 영위하는 경우에 Business 자체가 개별국가에서 독립적으로 이루어지는 서비스라면 언어별 별개의 독립시 그러나, 통합된 서비스와 프로세스를 지원하고자 할 경우에는 개별 언어별로 시스템을 구축하는 것은 구축과 관리 측면에서의 비용 증가가 Business의 효율성을 저하시킬 것이다. 여기에 대한 대안이 I18N, L10N에 기초한 Multilingual Support Database를 구축하는 것이다.

Multilingual Support Database in a Client/Server

Multilingual Support Database in a Multi-tier Configuration

이상으로 Globalization 및 Multilingual Support Database에 대한 기본 개념에 대해 알아보았다. 실제 구축 작업에 있어서는 DB뿐만 아니라 시스템 작업 환경에 대해 세부적으로 고려해야 할 사항이 매우 많아진다. 현재 유럽, 중국, 일본 등 사업영역 확대를 고려중이라면 IT 측면의 효율성과 비용, 즉 ROI와 TCO를 고려하여 한 번쯤 생각해 보아야 할 것이다.

이어지는 연재부터 약 3회에 걸쳐 Multilingual Support Database를 구축하는데 필요한 기술적 요소에 대해 세부적인 내용이 진행될 것이다. DB는 Oracle을 기준으로 진행될 것이며, Unicode는 3.1을 기준 SPEC으로 삼을 것이다.



제공 : DB포탈사이트 DBguide.net