Training
Contact
News
About Us
Member




Cloudera > Data-Analysts & Scientists

DSCI-272: Predicting with Cloudera Machine Learning (자격증 바우처 포함)

*본 과정은 Cloudera 자격증 바우처 포함 과정입니다! 수강 완료 시, 정가 $330의 시험 바우처를 50% 할인된 가격으로 제공해 드립니다.

엔터프라이즈 데이터 사이언스 팀은 머신러닝 워크플로우를 개발하고 배포하기 위해 비즈니스 데이터, 도구, 컴퓨팅 자원에 협업 방식으로 접근할 수 있어야 합니다. Cloudera 플랫폼의 일부인 Cloudera AI는 이러한 요구를 충족하는 솔루션을 제공하여 데이터 사이언스 팀이 필요한 자원을 확보할 수 있도록 지원합니다.
이 4일 과정에서는 Cloudera AI를 활용한 머신러닝 워크플로우 및 운영(MLOps)을 다룹니다. 참가자는 데이터를 탐색하고 시각화하며 분석하는 방법을 배우고, 머신러닝 모델을 학습, 평가 및 배포하는 전 과정을 경험하게 됩니다.
과정은 가상의 기술 회사를 배경으로 한 현실적인 시나리오와 데이터셋을 기반으로 엔드 투 엔드 데이터 사이언스 및 머신러닝 워크플로우를 따라 진행됩니다. 데모와 실습은 Python(PySpark 포함)을 사용하여 Cloudera AI 환경에서 수행됩니다.

3,083,000

수강대상

데이터 엔지니어, 개발자, 솔루션 설계자

교육목표

강의와 실습을 통해 참가자는 다음과 같은 내용을 학습하게 됩니다.

- 머신러닝 실험을 위한 데이터를 찾기 위해 Cloudera SDX 및 Cloudera 플랫폼의 구성 요소를 활용하는 방법
- Cloudera AMP(Accelerators for Machine Learning Projects)를 사용하는 방법
- 머신러닝 실험을 관리하는 방법
- 다양한 데이터 소스에 연결하고 데이터를 탐색하는 방법
- 머신러닝 모델을 REST API로 배포하는 방법
- 배포된 머신러닝 모델을 관리 및 모니터링하는 방법

강의내용


Git
- 버전 관리 소개: 협업 환경에서 버전 관리의 중요성 이해
- Git 기본: 초기화, 클론, 커밋, 푸시, 풀
- 브랜치 및 병합 전략: 효율적인 협업 기법
- 실습: 저장소 생성 및 관리

CI/CD
- CI/CD 개념 소개: 지속적 통합 및 배포의 기본
- 도구 개요: GitHub Actions
- 실습: GitHub Actions 활용
- 실습: GitHub Actions로 CI/CD 파이프라인 구축

Docker
- 컨테이너 기술 소개: 컨테이너화 개념 이해
- Docker 아키텍처 및 구성 요소
- Docker 이미지 및 컨테이너 생성 및 관리
- Dockerfile 기본: Dockerfile 작성법
- 실습: 간단한 애플리케이션 컨테이너화

Kubernetes
- 컨테이너 오케스트레이션 소개: Kubernetes 기본
- Kubernetes 아키텍처 및 구성 요소
- 실습: Kubernetes에서 애플리케이션 배포


Cloudera AI 소개
- Cloudera AI 개요: 주요 기능 및 역량 소개
- Cloudera AI 환경 탐색
- 실습: 프로젝트 생성 및 관리

Cloudera AI에서의 실험
- MLflow 개요: 핵심 개념 및 Cloudera AI와의 통합
- Cloudera AI에서의 실험 관리
- 실습: MLflow를 활용한 MLOps

AI Registry
- 개요: AI Registry 개념 소개
- 온보딩 가이드: 모델 등록 단계별 안내
- 아키텍처 개요: AI Registry 구조 이해

Cloudera AI API 활용
- Cloudera AI API 개요: 플랫폼과의 프로그래밍 기반 상호작용
- Cloudera AI API 사용법: 프로젝트, 작업, 모델, 애플리케이션 관리
- 실습: Cloudera AI API Python 클라이언트 활용


Cloudera AI에서의 MLOps
- MLOps 소개: 핵심 개념 및 원칙
- MLOps 워크플로우: 개발부터 운영까지
- 주요 과제 및 모범 사례
- 실습:
환경 연결 및 설정
데이터 수집, 탐색 및 모델 학습
모델 배포 및 운영
모델 레지스트리 및 API 활용
모델 메트릭 스토어를 통한 모델 관리

머신러닝 시스템 모니터링
- Evidently AI를 활용한 지속적 모델 모니터링: 성능 추적 및 데이터 드리프트 감지
- 모델 모니터링의 중요성
- 머신러닝 시스템 모니터링의 기본 원칙 및 모범 사례
- Evidently & Cloudera AI 기반 모니터링 설계
- 실습: Evidently AI를 활용한 지속적 모델 모니터링

AI 워크벤치 구성 및 관리
- Cloudera AI Workbench 프로비저닝
- Cloudera AI Workbench 관리
- Cloudera AI 자동 확장(Auto-Scaling)
- 실습: Grafana 대시보드를 활용한 운영 모니터링


데이터 접근 및 계보(Lineage)
- SDX 개요
- 데이터 카탈로그
- 권한 관리
- 데이터 계보
- 실습: 데이터 접근

Cloudera AI에서의 데이터 시각화
- 데이터 시각화 개요
- Cloudera 데이터 시각화 개념
- Cloudera AI에서의 시각화 활용
- 실습: 시각화 애플리케이션 구축

AMPs 및 워크벤치 소개
- 에디터 및 IDE
- Git
- 내장 웹 애플리케이션
- AMPs
- 실습: Streamlit 활용

자동 확장, 성능 및 GPU 설정
- 워크로드 자동 확장
- GPU 활용
- 실습: GPU를 활용한 딥러닝