리포트

DBMS, DB 구축 절차, 빅데이터 기술 칼럼, 사례연구 및 세미나 자료를 소개합니다.

멀티미디어 데이터베이스

리포트
DBMS별 분류
Etc
작성자
dataonair
작성일
2003-01-01 00:00
조회
6701
pdf.gif10-71.pdf











1. 서론

근래에 들어 그림, 사진, 영화, 음악 등을 컴퓨터에 저장하고 네트워크를 통하여 전송할 수 있음에 따라 멀티미디어는 정보활용의 중요한 부분을 차지하게 되었고 사용량도 급속히 증가하고 있다. 이에 따라 데이터베이스 기술도 기존의 문자 위주에서 멀티미디어를 지원할 수 있게 발전하였고 대용량의 멀티미디어 정보를 저장하고 사용자가 원하는 형태로 신속히 검색할 수 있게 되었다.
따라서 전자도서관, 원격진료, 홈쇼핑, 원격교육 등의 다양한 멀티미디어 응용이 출현하고 있으며 MPEG 등의 멀티미디어 표준도 개발되고 있다. 멀티미디어 데이터베이스의 기술적인 면에서는 모델링과 사용자 인터페이스에서 객체지향기술이 활용되고, 내용기반 검색을 위하여 고차원 색인 기술, 차원 축소 기술, 사용자와의 상호작용에 기반 한 기술 등이 개발되었으며, 질의처리를 위하여 선택율 추정 기술 등이 개발되었고 그 외에도 다양한 기술들이 개발되었다. 그러나 이질적인 여러 종류의 멀티미디어를 저장하고 방대한 멀티미디어 데이터베이스로부터 정확하고 효율적인 검색을 하기 위해서는 아직도 많은 연구가 필요하다.
본 논문에서는 멀티미디어 데이터베이스 시스템이 갖추어야 할 요구사항과 이를 지원하기 위한 기본 구조를 소개하고, 멀티미디어 데이터베이스의 가장 독특한 요소인 내용기반 검색에 관하여 설명하고, 앞으로의 연구방향에 대하여 살펴본다.

2. 멀티미디어 데이터베이스 시스템의 특성

멀티미디어 데이터베이스 관리 시스템(Multi- media Database Management System, MDBMS)은 이미지, 비디오, 오디오, 지리 정보, 문서 데이터 등을 포함하는 다양한 미디어 데이터를 처리, 저장, 검색, 상연할 수 있는 시스템으로 생각할 수 있다. 이론적으로 성공적인 MMDBMS에 대한 요구 사항으로는 다음과 같은 것들을 들 수 있다.

  1. 서로 다른 형태의 다양한 데이터에 대해 질의할 수 있어야 한다. 예를 들어, MMDBMS는 이미지 데이터나 비디오 데이터, 관계형 데이터에 대해서도 질의할 수 있어야 하며 그 결과를 함께 통합할 수 있어야 한다.
  2. 멀티미디어 데이터에 첨가한 키워드나 속성에 의한 텍스트 기반의 질의, 검색뿐만 아니라 멀티미디어 데이터 자체의 미디어 내용에 기반하여 질의, 검색, 브라우징 할 수 있어야 한다. 예를 들면, 칼라 히스토그램에 의한 이미지 검색, 비디오 시퀀스에 기반한 비디오 검색, 흐밍에 기반한 음악 데이터 검색 등을 지원할 수 있어야 한다.
  3. MMDBMS는 질의 결과를 시청각적 매체를 통해 상연할 수 있어야 하고, 사용자도 원하는 상연 형태와 내용을 질의로 표현할 수 있어야 한다.
  4. 현대의 데이터베이스에서는 많은 사용자가 인터넷을 통해 데이터베이스를 접근하므로 MMDBMS는 다양한 서비스 요구 사항의 품질(Quality of Service)을 만족하도록 이러한 상연을 전송할 수 있어야 한다. 따라서 사용자에게 상연을 전달할 때에는 버퍼의 가용성이나 대역폭등을 고려해야 한다.
  5. MMDBMS는 연속적이고 유연하게 미디어 데이터를 상연할 수 있도록 저장 장치로부터 이들 데이터를 연속적이고 유연하게 도출할 수 있어야 한다. 일반적으로 멀티미디어 데이터는 전통적인 관계형 데이터와 비교할 때, 방대한 용량의 크기를 요구하므로 이들을 디스크나 CD-ROM 같은 저장 장치에 효율적으로 저장하고 스케줄링 할 필요가 있다. 또한 데이터의 단위가 크므로 다중사용자 관점에서 동시성 제어나 고장회복 방법도 달라져야 한다.
그러나 위에 기술한 내용을 전부 지원하는 MMDBMS는 아직 존재하지 않으며 이와 관련된 많은 연구가 아직 진행 중이다. 아울러 현재의 상용 DBMS 중에서 멀티미디어 응용에 특별히 초점을 맞춘 MMDBMS 라고 할 만한 것은 없다고 할 수 있으며, 관계형 데이터베이스나 객체지향형 데이터베이스 위에 내용 기반 멀티미디어 검색 및 브라우징, 상연을 수행하기 위한 멀티미디어 엔진을 탑재한 형태를 취하여 멀티미디어 데이터의 저장, 질의, 상연, 전송을 지원하고 있다.

3. 멀티미디어 데이터베이스 시스템의 설계 및 구조

다양한 타입의 미디어를 지원하는 멀티미디어 데이터베이스 시스템을 설계할 때는 각 미디어 데이터의 내용에 대한 논리적인 구성과 함께 저장 장치에서의 물리적인 배치를 어떻게 할 것인지에 대한 문제에 직면하게 된다. 다음과 같은 세 가지 구성을 고려할 수 있다.

  1. 독립 구조의 멀티미디어 데이터베이스: 각 타입의 미디어에 대한 사용의 효율성을 최대화하기 위해 각 타입의 미디어에 적합한 형태로 각 미디어 타입의 데이터를 분류하고 그룹 지어 사용한다. [그림 4-10-36]
    • 251_1.gif
  2. 통합 구조의 멀티미디어 데이터베이스: 모든 미디어 타입을 통합된 하나의 자료 구조 (색인)를 통해 표현하고 질의할 수 있는 구성을 갖도록 데이터베이스 시스템을 구성한다. [그림 4-10-37]
    • 251_2.gif
  3. 복합 구조의 멀티미디어 데이터베이스: 위의 두 형태의 멀티미디어 데이터베이스 시스템을 결합한 형태로 데이터베이스 시스템을 구성할 수 있다.[그림 4-10-38] 즉, 특정 미디어는 자신의 색인 구조를 사용하고, 나머지는 통합된 하나의 색인 구조를 사용한다.
    • 252.gif
이러한 세 가지 형태의 멀티미디어 데이터베이스 시스템은 나름대로의 장단점을 갖고 있다. 독립 구조의 멀티미디어 데이터베이스 시스템에서는 각 미디어별로 독립적인 저장 및 색인 구조와 질의 처리 알고리즘을 사용한다. 이 독립된 멀티미디어 데이터베이스 구조가 현재 대부분의 멀티미디어 데이터베이스 시스템에서 사용하고 있는 구성이다. 이 구성에서는 각 개별 미디어 데이터를 처리하기 위한 효과적인 자료 구조 및 질의 처리 알고리즘을 개발할 수 있기 때문이다. 그러나 개별 미디어가 아닌 말 그대로 멀티미디어 데이터에 대한 질의를 처리하기 위해서는 서로 다른 색인 구조를 통해 나온 결과를 조인하는 등의 연산이 추가로 필요하며 그 비용이 상당히 비싸다.
통합 구조의 멀티미디어 데이터베이스 시스템은 이미지, 비디오, 오디오, 문서 등의 내용에 관한 정보를 하나의 공통의 자료 (색인) 구조를 통해 표현하므로 개별 미디어가 아닌 멀티미디어 데이터에 대한 질의를 효과적으로 처리할 수 있다고 생각할 수 있다. 그러나 실제로 서로 다른 특성의 미디어에 대해 하나의 공통 자료 구조 및 그 위에서의 질의 처리 알고리즘을 개발하는 것은 기술적으로 어려우며, 아울러 각 미디어 고유의 특성을 효율적으로 처리할 수 있는 능력을 상실할 가능성이 높다.
따라서 독립 구조와 통합 구조의 멀티미디어 데이터베이스 시스템의 단점을 어느 정도 해소하고 장점을 부각시키기 위해, 자연스럽게 [그림 4-10-38]과 같은 복합 구조의 멀티미디어 데이터베이스 시스템을 개발하게 된다. 그러나 여전히 (개별 미디어가 아닌) 멀티미디어 정보에 대한 처리는 개별 미디어 처리에 비해 상당히 비싼 연산이다.

4. 내용 기반 멀티미디어 엔진

앞서도 언급하였지만 현재 많은 상용 DBMS는 자체의 DBMS 위에 내용 기반 멀티미디어 엔진을 탑재하여 멀티미디어 데이터를 처리하고 있다. 이러한 멀티미디어 엔진은 IBM, Virage, Excalibur 등의 전문 개발사에 의해 제공되고 있다. 본 절에서는 가장 대표적인 멀티미디어 엔진인 IBM의 QBIC(Query By Image Content)에 대해 간단히 기술함으로써 멀티미디어 데이터베이스 시스템의 핵심 부분을 설명하고자 한다.
[그림 4-10-39]는 QBIC의 전체 시스템 구조도이며, [그림 4-10-40]은 QBIC에서 칼라 히스토그램을 사용하여 이미지 데이터베이스를 검색한 모습을 나타낸다. QBIC은 예제 이미지, 사용자의 스케치나 그림, 이미지의 칼라나 질감 정보, 이미지에 내재한 객체의 모양, 카메라와 객체의 움직임, 키워드와 텍스트 속성 등을 통해 이미지 데이터베이스와 비디오 데이터베이스를 검색할 수 있도록 개발된 멀티미디어 엔진이다.

  • 253_1.gif
253_2.gif
내용 기반 멀티미디어 데이터베이스 검색을 위한 데이터베이스 구축을 위해서는 먼저 미디어 데이터로부터 내재한 특성 (칼라, 질감, 모양, 카메라 및 객체 움직임, 객체의 시공간 정보 등)을 추출하고, 아울러 키워드나 필요한 텍스트 정보를 추가하여 검색에 필요한 메타데이터를 구축한다.
멀티미디어 메타데이터는 일반적으로 100차원 이상의 아주 고차원 벡터로 표현되고, 이러한 고차원 메타데이터를 통한 검색을 효율적으로 지원하기 위한 색인이 필요하다. R*-tree, grid- file로 대표되는 전통적인 다차원 색인 기법들은 멀티미디어 메타데이터 같은 고차원 정보의 색인에는 아주 비효율적이므로 QBIC에서는 단순히 순차 검색을 사용하고 있다. 그러나 최근에 LPC-file, LPC+-file, GC-tree와 같은 고차원 멀티미디어 데이터에 적합한 색인 기법이 새로 개발되었다.
멀티미디어 데이터베이스에서의 대표적인 질의 형태는 전통적인 완전 매치 및 부분 매치에 의한 질의보다는 “주어진 사진의 인물과 가장 유사한 인물이 나오는 이미지나 비디오 클립을 추출하라”와 같은 멀티미디어 데이터의 유사도에 기반한 질의가 대부분이다. 따라서 멀티미디어 색인 기법 및 질의 처리 알고리즘은 이러한 유사도 기반 질의 처리를 효율적으로 처리하는 기법에 초점을 맞추고 있다.

5. 결론 및 향후 과제

멀티미디어 데이터베이스는 다양한 미디어를 포함하는 흥미있는 새로운 분야이며 관련된 많은 기술이 필요하다. 본 백서에서는 멀티미디어 데이터베이스 시스템의 특성과 현재 각 국에서 연구, 개발 중인 중요 기술 분야에 대해 기술하였다. 그러나 현재까지의 대부분의 연구에서는 멀티미디어 데이터 및 메타데이터의 표현은 정형화된 형식을 띄고 있다고 가정하고, 주로 멀티미디어 검색 엔진의 개발에 연구의 중심을 두어왔다. 즉, 멀티미디어 데이터도 전통적인 관계형 데이터베이스나 객체 지향형 데이터베이스 시스템에 의해 모델링되고 저장되고 있으며, 단지 내용 기반 검색을 위한 멀티미디어 엔진이 멀티미디어 데이터베이스 시스템의 특성을 나타내고 있다.
그러나 인터넷(혹은 World Wide Web) 상에는 많은 멀티미디어 데이터베이스가 존재하며 이들의 표현은 각기 다른 형태로 존재한다. 따라서 최근의 일부 연구에서는 멀티미디어 메타데이터가 준구조적인(Semistructured) 혹은 구조가 없는(Unstructured) 형태로 되어있을 경우의 멀티미디어 엔진에 관한 개발을 고려하고 있다. 즉, XML, SMIL 같은 표준 언어로 멀티미디어 정보를 표현하고 검색하기 위한 연구가 필요하며, 이를 지원하는 경로(Path)에 기반한 질의 언어, 색인 기법, 질의 처리 알고리즘, 저장 기법의 개발이 요구된다.

제공 : DB포탈사이트 DBguide.net