데이터의 중심 빅데이터 아카데미
-
과정 안내 및 신청 > 빅데이터 분석 전문가
(비정형) 빅데이터 분석 전문가 과정 38기
과정개요
-
교육목표
– 데이터를 이용한 분석 프로세스 흐름 파악 및 각 과정(수집, 정제, 분석, 활용)에 대한 이해
– 분석 툴 사용법에 대한 기초 교육 및 실습을 통한 데이터 분석 경험 축적
– 비정형 데이터 분석 기법의 기초가 되는 알고리즘/방법론의 교육
– 이미지/자연어/센서 데이터의 구조 이해 및 실제 적용/응용 사례 교육 -
교육대상
1) 우선지원대상기업 소속 재직자
* 이외 중소기업 요건을 갖춘 기업도 우선지원대상기업으로 간주(동법 시행령 12조 2항)
2) 고객분석 및 마케팅, 데이터 분석 등의 경력자
3) 빅데이터 프로젝트 수행 또는 예정 인력 대상 -
교육기간
1) 사전교육 : ‘22.08.01.(월) ~ 08.21.(일), 온라인 학습
2) 집체교육 : ‘22.08.22.(월) ~ 09.02.(금), 10:00~18:00(온라인)
3) 프로젝트 : ‘22.09.05.(월) ~ 10.14.(금), 오프라인으로 진행
* 프로젝트 멘토링 및 스터디(1-4주차) : 주 1회 토요일, 10:00~15:00
* 프로젝트 발표회(5주차) : 10.14.(금), 19:30~21:30 -
교육인원
25 명
-
준비사항
1) 중식 및 주차는 지원이 불가합니다.
2) 개인 노트북을 반드시 지참해주시기 바랍니다.
3) 교육비 전액 지원 -
유의사항
1) 본 프로그램은 산업계 재직자 대상 과정으로 공무원, 교수, 학생, 미취업자 등은 신청이 불가합니다.
2) 빅데이터 분석 전문가 과정 수료생은 신청이 불가합니다.
3) 당해연도(2021년) 빅데이터 아카데미 수료생은 차년도부터 타 교육과정 신청이 가능합니다.
※ 단, 수료생은 교육과정별 총 정원의 20% 내외에서 선발
4) 증빙 서류 제출 이후 수강 취소자 또는 미수료자의 경우 해당연도를 포함하여 2년간 신청이 불가합니다. -
수료기준
<아래 조건을 모두 충족>
1) 사전 교육 이수
2) 교육 출석률 80% 이상 달성
* 출석률은 집체교육과 파일럿 프로젝트를 기준으로 산정합니다.
3) 파일럿 프로젝트 산출물 제출
상세 커리큘럼
구분 | 교과목명 | 상세내용 | 시간(기간) | 교육장 |
1단계 (사전교육) | 데이터 분석의 기초 |
- 데이터 분석 개요 - 확률과 확률분포 - 통계적 추론 - 분포에 관한 추론 - 데이터의 탐색 |
8.1 ~ 8.21 | Kdata 제공 |
회귀 분석 |
- 상관분석 & 회귀분석 & 잔차분석 - 이상점과 영향점 - 다중공선성 - 변수 선택과 모형 선택 |
|||
2단계 (집체교육) | 빅데이터 분석 소개 |
- 빅데이터의 특성(데이터 다양성 관점) 이해 - 비정형 데이터 종류 및 특징 - 데이터 분석 프로세스 이해 |
8.22 | 온라인 |
데이터 분석을 위한 파이썬 기초 |
- 파이썬 소개 및 환경 설정 - 파이썬 기초 문법 . 변수와 자료형 . 제어문 . 입력과 출력, . 함수 등 |
|||
데이터 핸들링 실습 |
- 데이터 읽고/쓰기 - numpy를 이용한 다차원 배열 처리 - pandas를 이용한 데이터 핸들링 |
8.23 | ||
데이터 시각화 |
- 데이터 시각화의 중요성 - matplotlib 를 이용한 데이터 시각화 - seaborn을 이용한 데이터 시각화 |
|||
다양한 데이터 수집 방법 이해 |
- 다양한 공개 데이터 저장소 소개 - 공개 데이터 가져오기 - 비정형 데이터 (Website, SNS 등) 수집 방법 소개 |
|||
탐색적 자료 분석(EDA) 및 데이터 전처리방법이해 |
- EDA (Exploratory Data Analysis)를 통한 데이터 이해 - 데이터 전처리 (Data Cleansing, Data Imputation) - 샘플링 (Sampling) 및 집계 (Aggregation) |
8.24 | ||
데이터 분석을 위한 기초 통계 |
- 모집단과 표본 - 확률과 확률표본 - 통계적 추정과 검정 - 분포에 대한 추론 |
|||
기계학습 Ⅰ |
- 기계학습 개요 - 기계학습을 위한 기본 개념 (모델 평가 방법 등) - 지도학습 : 분류 분석 - Decision Tree, SVM - 지도학습 : 회귀 분석 - Linear Regression |
8.25 | ||
기계학습 Ⅱ |
- 비지도학습 : 군집 분석 - K-Means, DBSCAN - 비지도학습 : 연관 분석 - Association Rule - 차원축소: PCA - 앙상블기법 - Random Forest 등 |
8.26 | ||
딥러닝 소개 |
- 딥러닝 개요 - 합성신경망 구조- CNN (Convolutional Neural Network) - 순환신경망 구조- RNN (Recurrent Neural Network), LSTM (Long Short Term Memory) - 차원축소 및 생성 신경망 구조 - AE (Auto Encoder), VAE (Variational AE), GAN (Generative Adversarial Network) - Trensfer Learning |
8.29 | ||
딥러닝 프레임워크 |
- 과제 주제 및 목표 설정 - 활용 데이터 선정 - 데이터 수집 및 처리 계획 수립 |
|||
이미지 데이터 분석 Ⅰ |
- 이미지 데이터 분석 개요 - 이미지 분석 주제 별 특징 및 평가 방법 - 이미지 분류 (Image Classification) - 객체 인식 (Object Detection) - 픽셀단위 객체 인식 (Semantic Segmentation) |
8.30 | ||
이미지 데이터 분석 Ⅱ |
- 얼굴 인식 (Face recognition) - 포즈 인식 (Pose Estimation) - 기타 응용 예제 |
8.31 | ||
자연어(텍스트) 데이터 분석 Ⅰ (확률기반모델링) |
- 자연어(텍스트) 데이터 분석 방법 소개 - 자연어 분석을 위한 기본 개념 (단어사전, 말뭉치(corpora), 형태소분석기 등) - TFIDF를 이용한 연관관계 분석 - LDA 토픽 모델링을 이용한 연관관계 분석 |
|||
자연어(텍스트) 데이터 분석 Ⅱ (신경망기반모델링) |
- 순환신경망 기반 자연어 데이터 분석 이해 - 단어 벡터(word2vec)을 이용한 추론 - 개체명 인식 (NER, Named Entity Recognition), 정보 추출(Information Extraction) - 텍스트 요약 (Text Summarization), 텍스트 분류 (Text Categorization) - Transformer 모델 및 대형 모델 소개 (API 활용 실습) - Hugging Face 라이브러리를 이용한 자연어 분석 예제 |
9.1 | ||
센서 데이터 분석 |
- 시계열 데이터 분석 ((Time series analysis) 소개 - 센서 데이터 피크(Peak) 및 이상치(Outlier) 분석 - 센서 데이터 기반 예지보전 - 센서 데이터 기반 행동 분석 |
9.2 | ||
비정형 데이터 분석 활용 |
- 전체 교육과정 리마인드 - 비정형 데이터 분석 활용 사례 |
|||
3단계 (프로젝트) | 과제선정 |
- 과제 주제 및 목표 설정 - 활용 데이터 선정 - 데이터 수집 및 처리 계획 수립 |
9.17 | 오프라인 (장소는 추후 공지) |
EDA |
- 탐색적 자료 분석 - 데이터 전처리 - 데이터 마트 생성 |
9.24 | ||
모델링 |
- 분석 알고리즘 정의 - 모형 개발 및 검증 |
10.1 | ||
결과도출 |
- 모델링 결과 해석 - 인사이트 도출 - 보고서 작성 |
10.8 | ||
발표 및 평가 |
- 보고서 작성 - 결과 발표 및 평가 |
10.14 |
※ 상기 커리큘럼은 사정에 따라 변동될 수 있습니다
교육장소
집체교육 |
교육장비대면 교육 혹은 Kdata 주소비대면 교육 혹은 Kdata |
프로젝트 |
교육장비대면 교육 혹은 Kdata 주소비대면 교육 혹은 Kdata |