[DV사전] 전처리

케이디와 함께 펼쳐보는 데이터바우처 사전

케이디 이미지

오늘은 원자료를 데이터 분석 목적과 방법에 맞는 형태로

처리하기 위해 불필요한 정보를 분리, 제거하고

가공하기 위한 예비적인 조작을 뜻하는

‘전처리’에 대해 알아볼까?

 

 


 

‘전처리(Preprocessing)’란?

 

 

원자료를 데이터 분석 목적과 방법에 맞는 형태로 처리하기 위해

불필요한 정보를 분리, 제고하고 가공하기 위한

예비적인 조작을 뜻하는 단어입니다.

 

 

전처리 실행과정

 

ETL / 추출(Extract) > 변형(Transform) > 적재(Load)

 

일반적으로 전처리는 데이터 가공과정인

‘ETL 프로세스’로 진행됩니다. ETL 프로세스는

저장된 데이터를 추출해 요구사항에 맞게

변형한 후 원하는 곳에 적재하는 과정입니다.

 

 

전처리 방법

 

데이터 / 정제, 변환, 필터링, 통합, 축소

 

전처리는 ETL 프로세스 과정에서 데이터의

측정 오류를 줄이고 잡음, 왜곡, 편차 등을 최소화하기 위해

정제, 변환, 통합 등 다양한 전처리 방법을 사용합니다.

 

 

전처리의 필요성

 

 

정보화시대 발전에 따라 처리해야 할 데이터의 양이 증가하면서

전처리 업무의 양과 중요도 역시 증가했습니다.

따라서 대량의 데이터를 전처리할 수 있도록

솔루션과 기술을 갖춰야 할 필요가 있습니다.

 

 

데이터바우처에서 만나는 ‘전처리’

 

 

데이터바우처 지원사업에서는 다양한 전처리 분야를

포함하여 데이터 산업 고도화 및 활성화를 위한

데이터 가공 서비스를 지원하고 있습니다.

 

전처리를 비롯한 데이터바우처의 다양한 가공서비스 분야

 

전처리, 품질, 코딩, 시각, 정보추출 또는 조합, 태깅 또는 라벨링, 분석, 기타

 

또한, 전처리 분야 뿐만 아니라 품질·코딩·시각화·정보추출,

조합·태깅 또는 라벨링·분석 등 다양한 데이터

가공서비스 분야를 지원하고 있습니다.

 

데이터바우처 지원사업의 미래

 

 

데이터 산업 활성화를 위해 끊임없이 다양한

데이터 가공 기술을 발전시키고 있는 우리 기업들!

데이터바우처 지원사업을 만나

비즈니스 경쟁력이 강화될 예정입니다.

 

 

우리 삶을 편하게 만들어주는 ‘데이터’!

데이터바우처 지원사업이 함께합니다.

 

데이터바우처 캐릭터 케이디-얼굴

 

케이디가 알려주는 데이터바우처 사전! - 오늘의 주제 [전처리] / 과학기술정보통신부, 데이터바우처, Kdata 한국데이터산업진흥원

 

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다