데이터의 중심 빅데이터 아카데미

빅데이터 기술 전문가

과정개요

  • 교육목표

    1) 빅데이터 처리기술에 대한 기본 아키텍처 이해
    2) 실습을 통한 오픈소스 기반의 빅데이터 처리 기술 시스템을 구축
    3) 빅데이터 수집, 저장, 처리 능력 학습

  • 교육대상

    1) 우선지원대상기업 소속 재직자
    * 이외 중소기업 요건을 갖춘 기업도 우선지원대상기업으로 간주(동법 시행령 12조 2항)
    2) 개발자·DBA·SE 등의 경력자
    3) 빅데이터 프로젝트 수행 또는 예정 인력 대상

  • 교육기간

    1) 사전교육 : ‘21.06.07.(월) ~ 06.27.(일), 온라인 학습
    2) 집체교육 : ‘21.06.28.(월) ~ 07.09.(금), 10:00~18:00
    3) 프로젝트 : ‘21.07.12.(월) ~ 08.12.(목)
    * 프로젝트 멘토링 및 스터디(1-4주차) : 주 1회 토요일, 10:00~17:00
    * 프로젝트 발표회(5주차) : 08.12.(목), 19:30~21:30

     

  • 교육인원

    20 명

  • 준비사항

    1) 개인 PC 및 노트북 지참
    * ‘코로나바이러스 감영증-19 대응 빅데이터 아카데미 교육 운영 지침’ 에 따라 상반기 교육의 경우 집체교육을 비대면으로 전환하여 교육 실시
    * 노트북 및 컴퓨터 권장 사양
    – RAM 16Gb이상
    – 여유 DISK 100Gb이상
    – OS운영체제 : 윈도우10
    2) 교육비 전액 지원

  • 유의사항

    1) 본 프로그램은 산업계 재직자 대상 과정으로 공무원, 교수, 학생, 미취업자 등은 신청이 불가합니다.
    2) 빅데이터 기술 전문가 과정 수료생은 신청이 불가합니다.
    3) 당해연도(2021년) 빅데이터 아카데미 수료생은 차년도부터 타 교육과정 신청이 가능합니다.
    ※ 단, 수료생은 교육과정별 총 정원의 20% 내외에서 선발
    4) 증빙 서류 제출 이후 수강 취소자 또는 미수료자의 경우 해당연도를 포함하여 2년간 신청이 불가합니다.

  • 수료기준

    <아래 조건을 모두 충족>
    1) 사전 교육 이수
    2) 교육 출석률 80% 이상 달성
    * 출석률은 집체교육과 파일럿 프로젝트를 기준으로 산정합니다.
    3) 파일럿 프로젝트 산출물 제출

상세 커리큘럼

구분 교과목명 상세내용 교육기간
1단계 (사전교육) 빅데이터 처리 기술 개요
- Big Data란 무엇인가?
- Big Data 처리 기술 아키텍처
6.7 ~ 6.27
리눅스 기초 및 활용
- 리눅스 기초 및 활용
하둡 분산 파일 시스템
- Hadoop이란 무엇인가?
- HDFS(하둡 분산 파일 시스템)
- Hadoop 설치(Windows)
2단계 (집체교육) 빅데이터 기술전문가 과정 개요
- 빅데이터 처리 기술 소개
- 빅데이터 처리 기술 아키텍처
- 빅데이터 처리 기술 별 활용
- 빅데이터 처리 기술 실습환경 이해
6.28 10:00 ~ 18:00
분산 파일저장/ 분산 파일처리
- Hadoop개요
- Hadoop아키텍처의 이해
- HDFS/ YARN클러스터 구축
- HDFS/ YARN주요 명령어 실습
6.29 ~ 6.30
Spark기반 빅데이터 처리
- Spark개요
- Spark아키텍처의 이해
- Spark클러스터 구축
- Spark구조적/스트리밍 API 실습(PySpark)
7.1 ~ 7.2
분산 메시징 처리
- Kafka개요
- Kafka아키텍처의 이해
- Kafka클러스터 구축
- Kafka토픽&파티션 실습
- Kafka프로듀서&컨슈머 실습
7.5
ElasticStack를 활용한 데이터 수집,전처리,검색 및 시각화
- ElasticStack개요
- ElasticStack클러스터 구축
- Elastic Search API실습
- Filebeat를 활용한 데이터 수집
- Logstash를 활용한 전처리
- Kibana를 활용한 데이터 시각화
7.6 ~ 7.7
Data Lake실습
- 데이터 파이프라인 설계
- 빅데이터 처리 시스템 연동
- Data Lake실습
7.8 ~ 7.9
3단계 (프로젝트) 과제 선정
- 과제 주제 및 목표 설정
- 활용 데이터 선정
- 데이터 수집 및 처리 계획 수립
7.17 10:00 ~ 17:00
EDA
- 탐색적 자료 분석
- 데이터 전처리
- 데이터 마트 생성
7.24
모델링
- 분석 알고리즘 정의
- 모형 개발 및 검증
7.31
결과 도출
- 모델링 결과 해석
- 인사이트 도출
- 보고서 작성
8.7
발표 및 평가
- 보고서 작성
- 결과 발표 및 평가
8.11 19:30 ~ 21:30

※ 상기 커리큘럼은 사정에 따라 변동될 수 있습니다

교육장소





집체교육

교육장온라인

주소온라인

프로젝트

교육장비앤디파트너스 삼성역점

주소서울특별시 강남구 테헤란로 626 메디톡스빌딩 B1