Case Study

DBMS, DB 구축 절차, 빅데이터 기술 칼럼, 사례연구 및 세미나 자료를 소개합니다.

HP·KT 공동 개발 DR 시스템

Case Study
DBMS별 분류
Etc
작성자
dataonair
작성일
2004-07-08 00:00
조회
5651











HP·KT 공동 개발 DR 시스템

배충현 기자

비용 효율적 복구 환경 구축…서비스 향상·비즈니스 연속성 실현

‘The Value Networking Company’를 기업 비전으로 수립한 KT는 세계 초일류 기업으로 발돋움하기 위해 총력을 다하고 있다. 고객에게 최고의 기술력으로 최적의 맞춤형 솔루션을 제공함은 물론 최상의 서비스를 제공해 고객 만족 극대화를 꾀하고 있다. 최근에는 24시간 온라인 재해복구시스템 구축으로 완전한 비즈니스의 연속성을 실현했다. 특히 무정지 시스템을 구현함으로써 대내외적으로 기업의 신뢰성을 대폭 향상시켰으며, 대고객 서비스 체제를 완비하게 됐다.
미국 9·11 테러 참사 이후 세계 IT업계의 화두는 단연 재해복구시스템(DR: Disaster Recovery)에 모아졌다. 특히 비즈니스가 중단되면 대고객 서비스를 지속할 수 있는 기업만이 생존할 수 있다는 BCP(비즈니스연속성계획)의 중요도가 높아지면서 재해복구에 대한 대비책은 기업 생존이 걸린 중대한 사안으로 자리매김했다.
또한 최근에는 IT가 기업의 미션크리티컬한 영역을 담보하면서 각종 재해나 재난에 신속히 대응해 비즈니스의 연속성을 확보하는 것이 비즈니스 성공의 핵심적인 요소로 부각되고 있다.
이에 따라 국내외를 막론하고 업계 리딩 기업을 중심으로 재해복구시스템 도입에 열을 올리고 있다. 국내 최고 통신서비스기업인 KT 역시 IT가 기업 비즈니스의 핵심영역으로 급부상하면서 정보자원의 효과적인 관리와 운영에 심혈을 기울이고 있다.

040708_kc_hp_1.jpg

단기간에 완벽한 복구시스템 구현

이와 관련해 KT는 최근 자가의 핵심 정보시스템인 고객지원시스템(ICIS: Integrate Customer Information System) 부분에 대한 재해복구 체계를 성공적으로 수립함으로써 비즈니스 연속성을 확보하게 됐다. ICIS는 KT의 방대한 고객자료와 요금민원, 수·체납업무에 대한 전체 자료를 관리하는 핵심 정보시스템이다.
KT는 ICIS 업무에 재해복구시스템을 구축하면서 재해발생시 대고객 업무의 완벽한 서비스를 제공하는데 1차적인 목표를 뒀다. 시스템 구축 전에는 DR 도입 요건을 철저히 분석하는 한편 KT 자체 DR 솔루션인 DROMS를 개발해 재해복구시스템에 적용했다. 특히 재해복구에 대한 단위 및 통합 시험을 실시해 개발 후 체계적이고 즉각적인 대처 방안에 심혈을 기울였다.
재해복구시스템 도입의 핵심 요구사항인 무정지 운영체계를 구현하기 위해 KT는 집약적인 기술 노하우와 솔루션을 보유하고 있는 한국HP를 파트너로 선정해 시스템 구축에 돌입했다.
한국HP는 KT 재해복구시스템의 구축 요구사항에 적극 대응해 HPCS(Customer Support) 조직 내에 TSEC(Technical Service Expert Center)의 전문 인력을 투입해 3개월이라는 단기간에 완벽한 재해복구시스템을 구현할 수 있도록 했다.
KT와 한국HP는 재해복구시스템 구축 프로젝트에서 분석과 설계, 구축과 테스트, 검수와 운영의 3단계를 주요 구축 과제로 선정해 개발에 착수했다. 분석 및 설계 과정에는 No-Logging 등 업무 요건 파악과 시스템 구성 내역을 분석해 DR 솔루션 기능의 개선 항목을 도출했다. 구축 및 테스트 단계에서는 유휴 장비를 이용해 DR시스템을 구축했다. 설계 단계에서는 도출된 DR 솔루션의 개선 항목을 반영해 새롭게 솔루션을 개발했으며 단위 기능 및 통합 시험을 통해 재해복구시스템의 완성도를 높였다. 검수 및 운영 단계에서는 하드웨어 검수와 기능 시험을 거친 후 운영 매뉴얼을 작성하는 등 평시 및 재해발생시의 체계적인 운영 절차를 수립했다.
KT는 이번 시스템 구축을 위해 한국HP의 True64 기반 서버와 XP1024 스토리지 인프라, 그리고 네트워크 백본 라우터 등의 백업장비를 신규로 도입했으며, IT본부와 DR센터간 KT 155Mb 네트워크를 이용해 재해복구시스템을 구현했다. 18TB 규모의 데이터를 실시간으로 원격지인 대전까지 미러링함으로써 재해발생 24시간 이내에 데이터를 복구할 수 있는 체제를 마련했다.

자체 DR솔루션 개발해 적용

KT 재해복구시스템의 특징은 고압축기술과 병렬 스트리밍 I/O 기술을 적용, 데이터 전송시간을 대폭 감소시켰다.
KT 재해복구시스템의 또 다른 특징은 운영센터의 교체 유휴 장비를 대전 DR센터로 이전해 재구성함으로써 비용을 최소화한 것과 DR솔루션을 자체 개발한 것을 들 수 있다. KT가 개발한 DR솔루션 DROMS는 대용량 데이터의 압축이 가능하고 원거리 전송을 위한 가속 솔루션 기능이 탑재됐다. 특히 DR진행 부문의 모니터링이 가능해 재해복구에 대한 체계적인 관리과 시스템 안정성을 대폭 향상시킨 것이 특징이다. 또한 Archive Log 전송 및 적용, No-Logging과 File Sync 동기화가 가능하다.
결국 KT의 재해복구시스템은 저비용으로 원거리 대용량 복제를 가능케 하고 모니터링과 관리를 위한 그래픽유저인터페이스 환경을 제공하는 특징이 있다. 자체 개발한 DR솔루션은 운용시스템에 영향을 미치지 않고 전송시간을 단축해 전송 성능을 향상시켰다.
사실상 재해복구시스템은 시스템 자체뿐만 아니라 운영부문에 대한 중요도가 매우 높다. 재해발생시 신속하게 대응하고 복구함으로써 IT 자원을 보호하고 대고객 서비스 등 비즈니스 연속성을 유지해야 하는 당위성 때문이다. 이에 따라 KT는 재해 전환 이후 전산센터로 복구하는 지침과 절차를 체계적으로 수립했다. 장애복구 대상 시스템 및 시스템별 복구 데이터, 복구시점, 복구방법 및 절차, 데이터 복구 완료 후 정합성 검증, 기타 복구 운영에 필요한 사항 등을 포함하는 복구 운영 지침서를 작성해 재해복구시스템의 유지와 관리를 실현하고 있다.

중단없는 고객서비스 토대 마련

평시운영은 주전산센터에서 처리된 데이터를 재해복구센터로 백업하고 재해시에는 KT의 재해선언을 시작으로 네트워크 전환 및 시스템 IP변경을 통해 24시간내 DR 시스템이 운영 매뉴얼 및 모의훈련을 기초로 최단시간에 전환을 시키도록 구현했다.
KT는 고객지원시스템에 재해복구시스템 구축을 완료함으로써 고객에게 중단없는 서비스를 더욱 빠르게 제공할 수 있는 토대를 마련했다. 특히 최신 서버와 스토리지 고가용성 SAN 구현을 포함함에 따라 향후 새로운 서비스와 업계 표준환경에 대응할 수 있는 체제를 완비했다. 또 중요 데이터에 대한 백업 및 재해에 대비한 복구 체계를 수립함에 따라 정보자원과 중요 데이터의 안정적인 보호를 통한 비즈니스 연속성도 실현했다.
KT는 향후 전 업무에 대비한 운영 방안을 수립해 재해에 대한 즉각적인 응대는 물론 대고객 서비스 체제를 완비해 통신업계의 리딩 컴퍼니로서의 위상을 한층 강화한다는 계획이다.

INTERVIEW
040708_kc_hp_pro.jpg
이용천 KT IT본부 상무
‘재해로 인한 고객서비스 중단 원천 방지’
▲이번 재해복구시스템 구축배경과 의미는.
예기치 못한 재해나 재난에 대비하는 것은 궁극적으로 대고객 서비스 체제를 완비한다는 점에서 매우 중요하다. 이에 따라 KT의 핵심 인프라인 고객지원시스템(ICIS)에 재해복구시스템을 구축해 24시간 내에 데이터를 복구할 수 있는 체제를 마련했고, 이를 통해 정보자원과 중요 데이터를 보호하게 됐다는 점에서 의미가 있다. 특히 이기종시스템 간에도 데이터 미러링이 가능토록해 비용 효율적인 재해복구 환경을 구축했다. 아울러 유휴 장비의 활용도를 높이면서 중요 데이터의 백업을 위해 별도의 디스크도 도입해 설치했다. 이번 프로젝트의 가장 큰 성과는 고객 신뢰도가 크게 향상됐다는 점이다. 평시와 재해시 상황별로 완벽한 운영·대처방안을 확립하고 상반기와 하반기에 모의훈련 원천적으로 방지할 수 있게 됐다.
▲이번 시스템의 특징과 적용 솔루션은.
저비용으로 단기간에 완벽한 재해복구시스템을 구축한 것이 큰 특징이라고 할 수 있다. 프로젝트는 3단계로 세분화해 각 단계별 진행 사항을 점검하는 형태로 진행됐다. 먼저 비용 효율성을 높이기 위해 분석 및 설계 단계에서는 업무현황과 시스템 구성 내역을 파악했으며 DR솔루션 기능 개선 항목을 도출했다. 또한 유휴 장비를 이용해 DR시스템을 적용한 구축·테스트 단계를 거쳐 검수 운영 단계를 통해 운영 매뉴얼을 작성하고 평시와 재해 상황시 운영 절차를 수립했다. 특히 자체 DR솔루션을 개발해 운용시스템에 영향을 미치지 않고 전송시간을 단축해 성능을 향상시킨 점은 이번 프로젝트의 가장 돋보이는 부분이다. 특정 벤더의 패키지화된 솔루션을 도입하기 보다 KT의 시스템 환경에 맞춘 DR솔루션을 직접 개발해 시스템의 신뢰성과 고가용성을 구현했다. 시스템 구축 과정에서는 무정지 운영체제의 기술적 경험과 솔루션을 보유한 한국HP를 파트너로 삼아 글로벌 표준을 적용했다.
▲시스템 운영방안과 향후 계획은.
이번 프로젝트를 통해 재해가 발생하더라도 24시간 내에 완벽한 복구가 가능해졌다. 특히 대고객의 접점에 있는 서비스 부분을 적용한 것과 관련해 특별히 주요 데이터 손실에 대한 사전 대비로 고객정보보호를 강화했다. 또한 재해 발생시 예견되는 영업손실 등 경제적인 손실도 최소화하는데 중점을 두고 있다. KT는 효율적인 센터운영을 위해 재해 상황 선포 기준 및 대처 방안 등을 규율하는 운영절차를 수립한 상태이다. 또한 운영절차 숙지 및 신속한 대응을 위해 연 2회 모의훈련을 실시하고, 중요 데이터를 보호하며 상시 운용성 수준을 제고할 방침이다. 특히 고객 만족도와 신뢰도를 향상시켜 선도업체로의 지위를 더욱 공고히 할 것이다. KT 재해복구시스템 개요
▲시스템 특징
-데이터 실시간 미러링으로 24시간 이내 복구
-저비용으로 원거리 대용량 복제 실현
-무정지 운영체제 구현
-자체 DR솔루션 DROMS 개발
▲구축 기간
-2004년 1∼3월(3개월)
▲기대 효과
-재해에 대비한 복구체계 완료
-중요 데이터에 대한 백업체계 수립
-대고객 서비스 중단 최소화로 서비스 제고

제공 : DB포탈사이트 DBguide.net