Case Study

DBMS, DB 구축 절차, 빅데이터 기술 칼럼, 사례연구 및 세미나 자료를 소개합니다.

SK텔레콤 011리더스클럽

Case Study
DBMS별 분류
Oracle
작성자
dataonair
작성일
2002-01-01 00:00
조회
11294











SK텔레콤 011리더스클럽
웹 기반 성능관리 솔루션으로 장애 완벽 대처

SK텔레콤은 지난해 11월 Meta API 기술을 적용한 웹 기반 애플리케이션 성능관리 솔루션인 이글로벌테크놀로지의 프로액티브넷을 적용, 011리더스클럽에 대한 애플리케이션 모니터링 및 성능유지 관리에 들어갔다. SK텔레콤은 프로액티브넷을 도입한 후 비용 절감은 물론 구간별 응답 시간 점검을 통해 성능 저하 가능성이 있는 요인을 사전에 제거해 일정한 성능 유지가 가능해졌다고 밝혔다.

웹 애플리케이션은 하나의 시스템에 하나의 프로그램으로 구현되는 것이 아니라 여러 시스템에 걸쳐 수십개에서 수백개까지 연결되어 있다. 이 모든 애플리케이션의 성능 유지는 곧 전체 e-비즈니스 서비스 유지와도 연결되므로 e-비즈니스를 수행하는 기업에서는 이들 애플리케이션에 대한 자세하고 정확한 모티터링과 튜닝이 필요하다.
SK텔레콤이 프로액티브넷을 도입한 이후 후진적인 시스템 관리가 사라졌다. 프로액티브넷이 전체 인프라에 걸쳐 있는 모든 애플리케이션의 성능을 계속해서 주시하기 때문이다. 시스템에 연결된 애플리케이션 어느 부분에서든 트랜잭션 응답 속도가 저하되면 프로액티브넷은 담당자에게 즉시 알람을 주고 이 담당자는 문제의 근본 원인을 집어내기 위해 설계된 진단 툴에 원클릭으로 접속, 바로 교정작업이 가능하다. 따라서 실제 사용자들이 시스템에 대한 성능 저하를 경험하기 이전에 모든 문제가 해결되는 것이다.

실시간으로 모니터 리포트 제공
SK텔레콤이 그간 사용해 오던 시스템관리솔루션(SMS)들은 네트워크, 운영 애플리케이션, 데이터베이스, 그리고 웹 트랜잭션 관리까지의 각 시스템들을 독립적인 요소로 파악하고 모니터링 해왔다. 그러다 보니 전체적인 웹 성능에 문제가 있어도 그 원인을 파악하기가 매우 어려웠다.
프로액티브넷 솔루션을 선정한 SK 텔레콤은 2001년 9월 한달 내내 011 리더스클럽에 웹 서버, 웹 애플리케이션 서버, 오라클 데이터 베이스 서버, 네트워크 장비에 대한 성능 변수들을 모니터링 했다. 적용기간 동안 실제 사용자의 트랜잭션을 모니터링하고 이에 따른 서버 플랫폼, 데이터베이스, 애플리케이션간의 연관 관계를 평가했다.
프로액티브넷은 강력한 통계적 프로세스를 거쳐 011 리더스클럽 사이트에 존재하는 많은 성능 요소들에 대해 정상적인 범위를 자동적으로 인식하고 누적된 데이터와 비교, 비정상적인 이벤트 발생시 이를 자동 추적하고 결과를 기록했다. 그 결과 011 리더스클럽 웹사이트의 성능저하의 원인을 쉽게 밝혀낼 수 있도록 도와줄 뿐만 아니라 앞으로의 성능확장에 대한 계획을 세울 수 있도록 도왔다. 실제 고객입장에서의 성능저하는 자동적으로 그와 연관된 성능변수를 쉽고 빠르게 찾아 주게 되었다.
성능 관리솔루션 적용에서 모니터와 에이전트 설치를 위한 전통적인 프레임워크 관리시스템의 롤 아웃은 수개월, 심지어 수년이 걸릴 수 있다. 하지만 프로액티브넷이 SK텔레콤의 요구 사항들을 만족시키기까지는 3~4일이면 족했다. 프로액티브넷은 임계값을 자동 설치 및 적용하므로 수작업으로 임계값을 설치하기 위해 낭비되는 시간과 업무가 없기 때문이다. 또한 각 조직의 특화된 중요 비즈니스 사용자 트랜잭션을 구축 및 추적을 e-트랜잭션 레코더를 이용해 간단하게 처리하고 있다.
프로액티브넷은 SK텔레콤의 주요 비즈니스 목표를 나타내주는 간단하거나 또는 복잡한 웹 트랜잭션을 기록, 웹사이트 방문자들이 보고 경험하는 것을 모니터링한다.
만약 특정 트랜잭션에 대한 응답 시간이 평상시에는 3~4초 소요됐는데 갑자기 10초 이상이 소요됐다면 분명 라우터부터 데이터베이스 서버까지 각 구간 사이에 어떤 문제가 있을 것이다. 이때 각 구간 사이의 문제를 찾기 위해서는 애플리케이션 중심의 구간별 응답시간을 측정하는 것이 중요하다. 트랜잭션의 전체 응답시간이 느려질 때 같이 느려지는 구간이 발생하기 때문이다. 프로액티브넷은 Meta API를 적용, 느려지는 구간이 어디인지를 찾고 문제가 네트워크 구간인지 또는 서버인지를 스마트 필터를 이용해 문제의 근본 원인을 찾아냈다. 또 전체 응답시간과 연관된 구간별 응답시간을 같은 그래프에서 비교해서 전체 응답시간 그래프가 올라갈 때 같이 올라가는 구간별 응답시간 그래프를 함께 찾아낸다.
sol200201001_01.jpg
<그림1>SK텔레콤 011리더스 클럽 모니터링 구성도

sol200201001_02.jpg
<그림2>근본원인분석

고객 만족 극대화
프로액티브넷의 이같은 모니터 기록에 대한 리포트는 대게 리얼타임으로 제공되고 있다. 이 리포트들은 해당 담당자와 부서에 자동으로 이메일을 보내는 상세한 리포트에서 최상의 결정권자들이 필요로 하는 정리 리포트까지의 범위를 포함한다. 또한 각기 다른 관심을 두고 있는 서로 다른 사용자들을 위해서는 성능 정리와 용량 계획이 담긴 헬쓰레포트를 제공하기도 한다.
SK텔레콤이 프로액티브넷을 적용한 이후 가장 큰 변화는 애플리케이션 중심으로 하드웨어, 소프트웨어, 네트워크 통합 관리가 수행됨으로 인해 애플리케이션 레벨 모니터링 체계가 수립됐다는 것. 이를 통해 시스템 관리자는 즉각적인 종합 판단이 가능해져 관련 자원별, 구간별 모니터링이 가능해졌다. 또 기존 툴을 활용해 프로액티브넷과 연계 모니터링 체계를 구축하자 장애 발견 및 조치를 위한 체계적인 관리가 용이하게 됐다. 장애 발생시 대응 신간도 과거에는 상상할 수 없는 정도를 단축됐으며 장애 및 원인 분석 정보를 시스템화해 동일 장애 재발을 원천 봉쇄를 했다.
하지만 SK텔레콤이 프로액티브넷을 도입한 이후 얻은 가장 큰 성과는 시스템 관리자 차원의 업무 향상보다 고객관점에서 시스템의 성능을 보장받았다는 점이다.
sol200201001_03.jpg<그림3>프로액티브넷 도입후 변화된 모습

글·우보영 기자<bywoo@kyungcom.co.kr>

제공 : DB포탈사이트 DBguide.net