기술자료

DBMS, DB 구축 절차, 빅데이터 기술 칼럼, 사례연구 및 세미나 자료를 소개합니다.

네트워크 분석의 이론과 적용 사례

기술자료
DBMS별 분류
Etc
작성자
dataonair
작성일
2016-11-16 00:00
조회
23112



네트워크 분석의 이론과 적용 사례



어디서나 쉽게 볼 수 있는 네트워크

네트워크 분석(Network analysis)은 사회학, 경제학, 경영학을 비롯한 사회과학 분야에서뿐만 아니라 물리학, 의학, 생물학 등의 자연과학 분야에서도 최근 많은 주목을 받고 있다.정보통신기술 및 인터넷 서비스의 발달로 인한 데이터의 증가 및 축적은 실무적으로도 네트워크 데이터의 활용 기회를 증대시키고 있기 때문이다.

인터넷 네트워크, 도로 네크워크, 화합물, 인용 네트워크, 유전 정보, 통신망, 전력망과 같이 우리 주변에 존재하는 많은 것들이 네트워크 형태로 구조화되어있다. 이와 같이네트워크는 우리 주변에 언제나 존재하여 왔고 오늘날 사회ㆍ경제시스템을 움직이는 핵심적 환경을 제공하고 있기 때문에 이에 대한 분석은 네트워크 구성요소 간 상호의존성을 이해하고 네트워크 전체의 효율성 및효과성을 증진하는 중요한 해결책을 제시할 수 있다.
네트워크 분석이라 하여 반드시 처음부터 관계를 가진 데이터만 쓸 수 있는 것은 아니다. 기존 RDB 데이터에 관계를 정의하여 가공할 수 있다면, 현재 가지고 있는 수많은 데이터를 가지고도 네트워크로 표현하고 구조를 분석할 수 있다.



tech_img4444.jpg

네트워크 분석 - 이론

네트워크 분석은 개인과 집단들 간의 관계를 노드(Node)와 링크(Link)로써 모형화하여, 그것의 구조나, 확산 및 진화과정을 계량적으로 분석하는 방법이다. 개체 자체의 속성에 중점을 둔 기존의 통계적인 연구방법과는 달리, 개체간의 상호 관계에 초점을 맞춘 방법이다. 네트워크 분석은 화학, 생물, 물리, 정보공학, 사회학, 인문학 등 다양한 분야에서 응용되고 있는 용어만 조금씩 다를 뿐 기본 원리는 그래프 이론에서 출발 했다고 할 수 있다. 소셜 네트워크 분석(SNA, Social Network Analysis) 역시 적용하는 대상과 용어만 다를 뿐 기본적인 분석 방법은 동일하다.



기본 요소 및 표현방식

네트워크 분석은 노드(Node)와 링크(Link)라는 두개의 요소로 이루어진 네트워크 그래프(Network graph)로 표현한다. 분석 방법에 따라 이름만 다르게 쓸뿐 내용은 동일하다. 이러한 기본적 요소를 각 분야에서 응용할 때 표현되는 노드와 링크의 이름과 형태, 속성을 추가 혹은 변형해서 사용하게 된다.네트워크는 크게 링크의 방향 유무에 따라 무방향 그래프(Undirected Graph)/유방향 그래프(Directed Graph), 링크의 가중치 유무에 따라 이진 그래프, 계량 그래프라고 구분해서 사용한다.

tech_img4445.jpg

위의 그림과 같이 네트워크 분석은 테이블(table), 인접행렬(Adjacent Matrix), 네트워크 그래프(Graph)로 표현 가능 하다. 첫번째, 테이블은 Source와 Target 두 속성으로 이루어져 있으며, 데이터 자체가 방향성을 표현 하게 된다. 행 하나가 링크 하나를 의미 하게 되며, 그래프의 성격에 따라 표현하는 방식의 차이가 있을뿐 네트워크 분석에 기본이 되는 관계 데이터 형식이다. 두번째, 인접행렬은 테이블 형식의 데이터를 가공한 것으로 행렬 자체로도 분석이 가능 하다. 무방향 그래프는 인접행렬이 대칭구조를 이루게 되고, 유방향 그래프는 비대칭이다. 각 행렬의 첫번째 줄은 노드의 번호를 의미하며 행렬 안의 숫자는 연결되어 있을 경우 1, 연결되어 있지 않으면 0으로 표현된다. 계량 그래프의 경우 행렬 안의 숫자는 링크의 갯수를 의미한다. 마지막으로, 네트워크 그래프(Graph)는 모든 관계 데이터를 표현 한 것으로 시각화를 위해 많이 사용된다. 노드와 링크의 모양, 크기, 색 등을 다르게 함으로써 다양한 표현이 가능하다.



tech_img4446.jpg

네트워크 분석 - 적용 사례

네트워크 분석에서 가장 중요한 것은 관계를 정의하는 것이다.기존의 속성이나 트랜잭션 데이터에서 관계를 정의 해줄수 있다면, 이를 기준으로 네트워크 분석에 필요한 관계 데이터로의 가공이 가능하다. 예로 들자면, SNS(Social Network Service)는 사용자 간에 Follow, Like 등을 이용해 관계를 정의한다.

아래에서 우리는 조금 더 쉽게 네트워크 분석을 이해할 수 있는 사례 두가지를 살펴볼 것이다. 각 사례에서 분석한 데이터와 정의된 관계를 파악하고 분석 결과를 해석한다.



사례 1. 대하드라마 ‘정도전’ 네트워크 분석

2014년 1월부터 6월까지 방영된 KBS 드라마 ‘정도전’에서 극중 인물간의 대화를 네트워크로 표현하여 권력 구조와 흐름을 분석한 사례이다. 데이터는 50회, 82명의 등장인물 그리고 1,701개의 대화를 대상으로 하였으며, 각 대화장면에 등장하는 인물 간 대화를 관계 데이터로 변환 하였다. 즉 드라마 한 대화 장면에 등장하는 인물들을 하나의 관계로 정의한다.

tech_img4447.jpg

위의 그림은 분석내용에 한부분으로, 왼쪽 네트워크 그래프를 통해 50회 분량의 드라마를 보지 않아도 드라마의 주요 등장인물 간의 권력 구조에 대해 한눈에 볼 수 있다. 오른쪽은 조선 건국의 대업을 이루어낸 1등 공신 정도전에게 이방원이 새로운 정적으로 등장하는 회를 네트워크 그래프로 표현한 것이다. 정도전파와 이방원파의 대립을 볼수 있으며, 이 둘의 사이에 이성계가 있는 것을 확인 할 수 있다.



사례 2. 신문기사 속 기업들간의 네트워크 분석

신문기사 내에서 출현한 기업들을 관계를 보기 위해 네트워크 분석 방법론을 적용한 사례이다. 데이터는 2015년 4월 부터 6월 동안에 RSS 수집기를 통해 5개 신문사를 대상으로 수집한 신문기사 속에서 기업들간의 관계 데이터를 추출하고 네트워크 그래프로 표현하였다. 여기서 관계는 하나의 신문 기사속에 같이 등장한 기업이다.

tech_img4448.jpg

위에 그림은 신문 카테고리 별로 분석한 네트워크 그래프 결과이다. 모든 기사속에서 특징이 보이지 않던 기업이 경제, 스포츠에 따라 도드라지는 기업이 발생하는 것을 볼 수 있다. 경제기사에서는 증시관련 기사로 인해 증권사가 도드라 지고, 스포츠 기사에서는 스포츠팀을 후원하는 회사가 대두되는 경향을 볼 수 있다.



결론

네트워크 분석은 학제적으로 많은 연구와 발전이 이루어진데 반해, 산업적으로 활용된 사례는 많지않다. 하지만 네트워크 분석은 표현이 단순하고, 수학적으로 뒷받침이 이루어진 이론들이 많기 때문에 다양한 현상들이 그래프로 만들어질 수 있다면, 현상을 이해하고 설명하는 데 풍부하게 활용될 것으로 보인다. 이를 발전시켜 비즈니스의 기회로 삼으려는 노력이 필요하다.