데이터이야기

DB 노하우, 데이터직무, 다양한 인터뷰를 만나보세요.

5회 - 빅데이터 분석을 하려면 어디까지 관심을 가져야 할까

데이터 이야기

작성자

dataonair

작성일

2014-10-14 00:00

조회

6015

5회 - 빅데이터 분석을 하려면 어디까지 관심을 가져야 할까

데이터 분석을 하다보면 정형 데이터, 비정형 데이터 등 다양한 데이터와 산업분야를 경험하게 됩니다. 정형 데이터 분석은 많이 알려져 있고 텍스트에 대한 비정형 데이터 분석도 활발하게 이루어지고 있습니다. 그러나 이 세상에 존재하는 수많은 데이터 유형에 자유롭게 접근하는 역량을 갖춘다면 여러분은 어떤 분류의 제약에도 억매이지 않고 데이터를 통해 의미있는 것을 창출할 수 있습니다.

저는 요즘 이미지, 사운드에 관심분야를 확장하고 있습니다. 이미지와 사운드는 산업불문하고 응용될 수 있고 지금까지 해오던 분야의 협소함을 극복할 수 있습니다. 최근 텍스트 데이터를 활용한 거짓식별을 마지막으로 이미지와 사운드로 분야를 바꾸었습니다. 결국은 텍스트, 이미지, 사운드를 모두 통합적으로 활용하고자 합니다.

이미지 활용은 우선 google maps를 이용해서 특정도시를 선택해서 자동차만을 식별하거나 오일 파이프라인을 식별하는 등, 일상생활 및 군사적 목적 등 다양한 활용이 가능한 분야의 적용가능성을 보니 공상과학 영화속의 내용처럼 식별을 해서 추적하는게 일정수준까지는 어렵지 않았습니다. 움직이는 물체에 대해 식별을 하거나 정지영상에 대해 정밀한 식별이 주요고제로 남아 있습니다. 사운드는 개, 고양이, 기타 동물의 소리를 식별하고, 상황을 파악해서 배가고픈지, 침입자가 있는지 등 7개 상황을 식별하는데도 80% 정확도로 성공을 하여 동물간의 언어교환을 시도하고 있습니다. 그리고 사람의 목소리를 언어 불문하고 거짓인지 식별하는 모델을 만들고 있는데 70% 정확도가 가능했고 모델의 정확도를 90%까지 높이려고 다양한 언어나 사람들의 목소리를 적용하려고 하는 중입니다.

특히 최근 MIT lab에서 시도한 음성을 통해 영상신호로 전달된 내용을 다시 음성으로 변환해서 도청을 하는 내용을 보았는데(http://newsoffice.mit.edu/2014/algorithm-recovers-speech-from-vibrations-0804) 이러한 시도를 해볼까 합니다. 조금 여력이 되면 음성에서 영상으로 갔다가 음성으로 다시복원해서 텍스트로 가고자 합니다. 11월 쯤이면 prototype을 볼수 있으리라 기대합니다.

이제는 우리가 IoT시대가 도래하여 다양한 디바이스를 통해 신호를 수집해서 거짓인지 진실인지 실시간으로도 알려줄 수 있고, 동물의 의사표현을 제한적이지만 파악할 수 있으리라 생각합니다. 이러한 접근을 응용하면 우리는 무한한 데이터를 정보로 활용해서 응용이 가능할것입니다. 의료, 교통, 재난, 국방 등 진정한 빅데이터의 시대가 눈앞에 다가옴을 느낍니다.

출처 : 한국데이터베이스진흥원

제공 : DB포탈사이트 DBguide.net

« 4회 - 다양한 분야에서 남이 이미 만들어 놓은 있는것 잘 활용하기

간단한 SQL 퀴즈 »

목록보기