데이터 인사이트

데이터 지식공유
나만 알기는 아까운 데이터 지식 함께나눠요.

데이터 분석으로 새는 물 잡기

작성자
관리자
작성일
2020-09-09 16:09
조회
73
 

중앙정부 및 지자체에서 발주하는 빅데이터 사업이 한창이었던 2013년. 상수도 업무에 데이터를 어떻게 활용할 수 있을지 점검해보는 분석을 진행한적이 있다.

당시에는 빅데이터를 잘 운영하고 관리하는데 초점이 맞춰진 프로젝트가 대부분이었다. 그러나 3년이 지난 지금, 데이터를 실제 업무에 활용하고 의사결정을 지원하는 도구로써 자리매김하면서 그 때의 프로젝트가 최근에 다시 주목받고 있어 데이터 스토리에서 공유하고자 한다.

분석지역은 남양주시였다. 모든 공간분석의 출발점은 그 지역에 대한 이해를 바탕으로 한다. 따라서 남양주시가 어떤 특징을 갖고 있는지 정량적으로 평가하는 것이 우선시된다.

아래 그래프에서 보면 남양주시는 농촌 비율과 아파트 비율이 경기도에 비해 높다. 즉 농가형 도심의 특성을 보이는 지역이라고 할 수 있다.

 

201607251469421448328_4b54c2e9-cdda-488b-80cb-fc26a68eeb8f.jpg

 

Figure 1.남양주시 특징

아래는 거주인구와 직장인구 분포를 나타내는 지도이다. 거주인구와 직장인구를 시간을 담은 용어로 바꾸면 야간상주인구와 주간상주인구로 나타낼 수 있다. 즉 아래 지도는 인구 분포 뿐만 아니라 주야간 물 사용량 패턴을 가늠할 수 있는 지표가 된다.

남양주시는 주야간 인구 패턴이 유사하므로 주야간 물사용량 패턴이 크게 등락을 보이지 않을 것이란 예측을 할 수 있다. 반면 강남 같은 경우는 주야간 물사용량 패턴이 크게 다를 수 있다.

또한 남양주시 인구는 공동주택에 거주하는 비율이 84%로 서울보다 약 15% 높은 것으로 분석됐다. 아마도 남양주시는 공동주택의 물소비에 주목해야할 필요가 있을 것이다.

 

201607251469421490768_934d57c5-69bb-4c6c-9d01-df140a051ec8.jpg

 

Figure 2. 남양주시 인구 분포

남양주시에서도 물사용량이 많은 지역의 특징을 살펴보기 위해 지자체가 보유한 블록별 물 사용량 데이터와 외부 데이터(인구, 가구, 주택, 건물 등)를 결합해 간단한 통계분석을 실시했다.

 

201607251469421519160_484e916e-54cf-4f50-819f-e375c8d359a6.jpg

 

Figure 3. 상수사용량과 거주 인구 분포

그 결과 거주유형별로 다른 특징이 나타났다. 아파트 밀집지역에서는 물사용량과 10세 미만 인구, 30평 미만의 아파트에서 상관관계가 높게 나타났으며, 아파트와 주택이 혼합된 지역에서는 40대 인구수와 상관관계가 높았다.

이 결과를 토대로 실제 물사용량과 적정치를 비교해서 물사용량이 과도하게 많은 지역이 어디인지 살펴봤다. 물사용량이 적정치보다 많은 지역과 상수도가 노후된 지역을 비교해서 누수가 발생했을 여지가 있는 지역을 골라내기 위한 작업이었다.

아래 그래프는 위의 통계분석 결과를 토대로 지역별 상수사용량 적정치와 실제 사용량을 비교한 것이다. 붉은색 직선 위에 있는 지역들이 적정치보다 물사용량이 많은 곳이다. 그리고 상수관로의 매설 년도를 기준으로 분포를 지도에 표시했다. 지도에서 붉은색으로 표시된 곳이 노후관로가 매설된 지역이다.

그래프와 지도를 비교해서 보면 물 사용량이 적정치보다 높고 상수관망이 노후된 곳이 존재한다. 물사용량이 많고 상수관망이 노후된 이러한 지역부터 상수관련 예산을 집행되는 것이 효율적일 것이라는 게 당시의 제안이었다. 물론 예산 집행 우선순위 지역에 대한 구체적인 지도도 함께 제시됐다.

 

201607251469421615981_92e5318d-48df-479d-bb24-94b65d2d7459.jpg

 

Figure 4. 상수사용량과 노후도

공공기관에서 보유하고 있는 데이터 중에 가치는 있지만 아직 업무에 활용하지 못하고 있는 데이터가 예상보다 많을 것으로 판단된다. 하지만 기관마다, 그리고 기관 내에서도 각 부처마다 서로 다른 가치와 형태를 갖는 데이터가 생산되기 때문에 데이터를 관리하는 하나의 주체에서 모든 업무를 아우를 수 있는 어떤 체계를 갖추는 것은 현실적으로 어렵다.

가장 좋은 모습은 내부 업무를 잘 알고 있는 사람이 데이터를 기술적으로 핸들링 할 수 있는 전문가의 도움을 받아 실제 업무에 활용하는 것이다. 다만 이 경우 외부 전문가는 기술적인 부분 뿐만 아니라 내부 업무에 대한 충분한 이해를 바탕으로 정책효과를 달성하는 것에 목적을 둔 사람이어야 할 것이다.