[DV사전] 전처리

케이디와 함께 펼쳐보는 데이터바우처 사전

케이디 이미지

오늘은 원자료를 데이터 분석 목적과 방법에 맞는 형태로

처리하기 위해 불필요한 정보를 분리, 제거하고

가공하기 위한 예비적인 조작을 뜻하는

‘전처리’에 대해 알아볼까?

 

 


 

‘전처리(Preprocessing)’란?

 

전처리 예시이미지 1번

 

원자료를 데이터 분석 목적과 방법에 맞는 형태로 처리하기 위해

불필요한 정보를 분리, 제고하고 가공하기 위한

예비적인 조작을 뜻하는 단어입니다.

 

 

전처리 실행과정

 

전처리 예시이미지 2번

 

일반적으로 전처리는 데이터 가공과정인

‘ETL 프로세스’로 진행됩니다. ETL 프로세스는

저장된 데이터를 추출해 요구사항에 맞게

변형한 후 원하는 곳에 적재하는 과정입니다.

 

 

전처리 방법

 

전처리 예시이미지 3번

 

전처리는 ETL 프로세스 과정에서 데이터의

측정 오류를 줄이고 잡음, 왜곡, 편차 등을 최소화하기 위해

정제, 변환, 통합 등 다양한 전처리 방법을 사용합니다.

 

 

전처리의 필요성

 

전처리 예시이미지 4번

 

정보화시대 발전에 따라 처리해야 할 데이터의 양이 증가하면서

전처리 업무의 양과 중요도 역시 증가했습니다.

따라서 대량의 데이터를 전처리할 수 있도록

솔루션과 기술을 갖춰야 할 필요가 있습니다.

 

 

데이터바우처에서 만나는 ‘전처리’

 

전처리 예시이미지 5번

 

데이터바우처 지원사업에서는 다양한 전처리 분야를

포함하여 데이터 산업 고도화 및 활성화를 위한

데이터 가공 서비스를 지원하고 있습니다.

 

전처리를 비롯한 데이터바우처의 다양한 가공서비스 분야

 

전처리 예시이미지 6번

 

또한, 전처리 분야 뿐만 아니라 품질·코딩·시각화·정보추출,

조합·태깅 또는 라벨링·분석 등 다양한 데이터

가공서비스 분야를 지원하고 있습니다.

 

데이터바우처 지원사업의 미래

 

전처리 예시이미지 7번

 

데이터 산업 활성화를 위해 끊임없이 다양한

데이터 가공 기술을 발전시키고 있는 우리 기업들!

데이터바우처 지원사업을 만나

비즈니스 경쟁력이 강화될 예정입니다.

 

 

우리 삶을 편하게 만들어주는 ‘데이터’!

데이터바우처 지원사업이 함께합니다.

 

데이터바우처 캐릭터 케이디-얼굴

 

케이디가 알려주는 데이터바우처 사전! - 오늘의 주제 [전처리]

 

관리자
Author: 관리자

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다