데이터의 중심 빅데이터 아카데미

(비정형) 빅데이터 분석 전문가 과정 38기

과정개요

  • 교육목표

    – 데이터를 이용한 분석 프로세스 흐름 파악 및 각 과정(수집, 정제, 분석, 활용)에 대한 이해
    – 분석 툴 사용법에 대한 기초 교육 및 실습을 통한 데이터 분석 경험 축적
    – 비정형 데이터 분석 기법의 기초가 되는 알고리즘/방법론의 교육
    – 이미지/자연어/센서 데이터의 구조 이해 및 실제 적용/응용 사례 교육

  • 교육대상

    1) 우선지원대상기업 소속 재직자
    * 이외 중소기업 요건을 갖춘 기업도 우선지원대상기업으로 간주(동법 시행령 12조 2항)
    2) 고객분석 및 마케팅, 데이터 분석 등의 경력자
    3) 빅데이터 프로젝트 수행 또는 예정 인력 대상

  • 교육기간

    1) 사전교육 : ‘22.08.01.(월) ~ 08.21.(일), 온라인 학습
    2) 집체교육 : ‘22.08.22.(월) ~ 09.02.(금), 10:00~18:00(온라인)
    3) 프로젝트 : ‘22.09.05.(월) ~ 10.14.(금), 오프라인으로 진행
    * 프로젝트 멘토링 및 스터디(1-4주차) : 주 1회 토요일, 10:00~15:00
    * 프로젝트 발표회(5주차) : 10.14.(금), 19:30~21:30

     

  • 교육인원

    25 명

  • 준비사항

    1) 중식 및 주차는 지원이 불가합니다.
    2) 개인 노트북을 반드시 지참해주시기 바랍니다.
    3) 교육비 전액 지원

  • 유의사항

    1) 본 프로그램은 산업계 재직자 대상 과정으로 공무원, 교수, 학생, 미취업자 등은 신청이 불가합니다.
    2) 빅데이터 분석 전문가 과정 수료생은 신청이 불가합니다.
    3) 당해연도(2021년) 빅데이터 아카데미 수료생은 차년도부터 타 교육과정 신청이 가능합니다.
    ※ 단, 수료생은 교육과정별 총 정원의 20% 내외에서 선발
    4) 증빙 서류 제출 이후 수강 취소자 또는 미수료자의 경우 해당연도를 포함하여 2년간 신청이 불가합니다.

  • 수료기준

    <아래 조건을 모두 충족>
    1) 사전 교육 이수
    2) 교육 출석률 80% 이상 달성
    * 출석률은 집체교육과 파일럿 프로젝트를 기준으로 산정합니다.
    3) 파일럿 프로젝트 산출물 제출

상세 커리큘럼

구분 교과목명 상세내용 시간(기간) 교육장
1단계 (사전교육) 데이터 분석의 기초
- 데이터 분석 개요
- 확률과 확률분포
- 통계적 추론
- 분포에 관한 추론
- 데이터의 탐색
8.1 ~ 8.21 Kdata 제공
회귀 분석
- 상관분석 & 회귀분석 & 잔차분석
- 이상점과 영향점
- 다중공선성
- 변수 선택과 모형 선택
2단계 (집체교육) 빅데이터 분석 소개
- 빅데이터의 특성(데이터 다양성 관점) 이해
- 비정형 데이터 종류 및 특징
- 데이터 분석 프로세스 이해
8.22 온라인
데이터 분석을 위한 파이썬 기초
- 파이썬 소개 및 환경 설정
- 파이썬 기초 문법 
  . 변수와 자료형
  . 제어문
  . 입력과 출력,
  . 함수 등
데이터 핸들링 실습
- 데이터 읽고/쓰기
- numpy를 이용한 다차원 배열 처리
- pandas를 이용한 데이터 핸들링
8.23
데이터 시각화
- 데이터 시각화의 중요성
- matplotlib 를 이용한 데이터 시각화
- seaborn을 이용한 데이터 시각화
다양한 데이터 수집 방법 이해
- 다양한 공개 데이터 저장소 소개
- 공개 데이터 가져오기
- 비정형 데이터 (Website, SNS 등) 수집 방법 소개
탐색적 자료 분석(EDA) 및 데이터 전처리방법이해
- EDA (Exploratory Data Analysis)를 통한 데이터 이해
- 데이터 전처리 (Data Cleansing, Data Imputation) 
- 샘플링 (Sampling) 및 집계 (Aggregation)
8.24
데이터 분석을 위한 기초 통계
- 모집단과 표본
- 확률과 확률표본
- 통계적 추정과 검정
- 분포에 대한 추론
기계학습 Ⅰ
- 기계학습 개요
- 기계학습을 위한 기본 개념 (모델 평가 방법 등)
- 지도학습 : 분류 분석 - Decision Tree, SVM
- 지도학습 : 회귀 분석 - Linear Regression
8.25
기계학습 Ⅱ
- 비지도학습 : 군집 분석 - K-Means, DBSCAN
- 비지도학습 : 연관 분석 - Association Rule
- 차원축소: PCA
- 앙상블기법
- Random Forest 등
8.26
딥러닝 소개
- 딥러닝 개요
- 합성신경망 구조- CNN (Convolutional Neural Network)
- 순환신경망 구조- RNN (Recurrent Neural Network),
  LSTM (Long Short Term Memory)
- 차원축소 및 생성 신경망 구조 - AE (Auto Encoder), VAE (Variational AE),
  GAN (Generative Adversarial Network)
- Trensfer Learning
8.29
딥러닝 프레임워크
- 과제 주제 및 목표 설정
- 활용 데이터 선정
- 데이터 수집 및 처리 계획 수립
이미지 데이터 분석 Ⅰ
- 이미지 데이터 분석 개요
- 이미지 분석 주제 별 특징 및 평가 방법
- 이미지 분류 (Image Classification)
- 객체 인식 (Object Detection)
- 픽셀단위 객체 인식 (Semantic Segmentation)
8.30
이미지 데이터 분석 Ⅱ
- 얼굴 인식 (Face recognition) 
- 포즈 인식 (Pose Estimation)
- 기타 응용 예제
8.31
자연어(텍스트) 데이터 분석 Ⅰ (확률기반모델링)
- 자연어(텍스트) 데이터 분석 방법 소개
- 자연어 분석을 위한 기본 개념 (단어사전, 말뭉치(corpora),
  형태소분석기 등)
- TFIDF를 이용한 연관관계 분석
- LDA 토픽 모델링을 이용한 연관관계 분석
자연어(텍스트) 데이터 분석 Ⅱ (신경망기반모델링)
- 순환신경망 기반 자연어 데이터 분석 이해
- 단어 벡터(word2vec)을 이용한 추론
- 개체명 인식 (NER, Named Entity Recognition),
  정보 추출(Information Extraction)
- 텍스트 요약 (Text Summarization), 텍스트 분류 (Text Categorization)
- Transformer 모델 및 대형 모델 소개 (API 활용 실습)
- Hugging Face 라이브러리를 이용한 자연어 분석 예제
9.1
센서 데이터 분석
- 시계열 데이터 분석 ((Time series analysis) 소개
- 센서 데이터 피크(Peak) 및 이상치(Outlier) 분석
- 센서 데이터 기반 예지보전
- 센서 데이터 기반 행동 분석 
9.2
비정형 데이터 분석 활용
- 전체 교육과정 리마인드
- 비정형 데이터 분석 활용 사례
3단계 (프로젝트) 과제선정
- 과제 주제 및 목표 설정
- 활용 데이터 선정
- 데이터 수집 및 처리 계획 수립
9.17 오프라인 (장소는 추후 공지)
EDA
- 탐색적 자료 분석
- 데이터 전처리
- 데이터 마트 생성
9.24
모델링
- 분석 알고리즘 정의
- 모형 개발 및 검증
10.1
결과도출
- 모델링 결과 해석
- 인사이트 도출
- 보고서 작성
10.8
발표 및 평가
- 보고서 작성
- 결과 발표 및 평가
10.14

※ 상기 커리큘럼은 사정에 따라 변동될 수 있습니다

교육장소





집체교육

교육장비대면 교육 혹은 Kdata

주소비대면 교육 혹은 Kdata

프로젝트

교육장비대면 교육 혹은 Kdata

주소비대면 교육 혹은 Kdata