하둡 생태계 개요
Hue를 사용하여 HDFS 데이터 및 Hive 테이블 작업
Cloudera Data Science Workbench 소개
Apache Spark 2 개요
데이터 읽기 및 쓰기
데이터 품질 검사
데이터 정리 및 변환
데이터 요약 및 그룹화
데이터 결합, 분할 및 변형
데이터 탐색
Spark 응용 프로그램 구성, 모니터링 및 문제 해결
Spark MLlib에서의 기계 학습 개요
피쳐 추출, 변형 및 선택
회귀 모델 작성 및 평가
분류 모델 구축 및 평가
클러스터링 모델 작성 및 평가
모델의 교차 검증 및 하이퍼 파라미터 조정
빌딩 기계 학습 파이프 라인
기계 학습 모델 배포

