Training
Contact
News
About Us
Member




Databricks > Machine Learning

Databricks를 활용한 고급 머신러닝

대규모 머신러닝
이 과정에서는 Apache Spark 아키텍처와 Databricks 환경에서 머신러닝 워크로드에 적용하는 방법에 대한 이론 및 실무 지식을 습득하게 됩니다. 데이터 준비, 모델 학습 및 배포에 Spark를 언제 사용해야 하는지 배우고, Spark ML 및 Spark 기반 pandas API를 직접 사용해 볼 수 있습니다. 또한, 이 과정에서는 하이퍼파라미터 튜닝, Spark를 이용한 Optuna 확장과 같은 고급 개념을 소개합니다. 더불어, 이 과정에서는 MLflow 및 Unity Catalog와 같은 관련 과정에서 소개된 기능과 개념을 활용하여 포괄적인 모델 패키징 및 관리를 구현합니다.

고급 머신러닝 운영
이 과정에서는 머신 러닝 라이프사이클과 MLOps에 대한 포괄적인 이해를 제공하며, 데이터 및 모델 관리, 테스트, 확장 가능한 아키텍처에 대한 모범 사례를 중점적으로 다룹니다. CI/CD, 파이프라인 관리, 환경 분리 등 주요 MLOps 구성 요소를 다루는 동시에 Databricks Asset Bundles(DAB), 워크플로, Mosaic AI Model Serving과 같은 Databricks의 자동화 및 인프라 관리 도구를 소개합니다. 모니터링, 사용자 지정 메트릭, 드리프트 감지, 모델 배포 전략, A/B 테스트, 안정적인 MLOps 시스템 원칙에 대해 학습하여 Databricks에서 ML 프로젝트를 구현하고 관리하는 데 필요한 전체적인 관점을 제공합니다.

1,450,000 원 (VAT별도)

수강대상

데이터 과학자 및 머신러닝 실무자 등

선수지식

- DS/ML 개념(예: 분류(classification) 및 회귀(regression) 모델), 일반적인 모델 지표(예: F1-score), 그리고 Python 라이브러리(예: scikit-learn 및 XGBoost)에 대한 기본적인 이해 - 전통적인 머신러닝 개념, 개발, 그리고 ML 프로젝트를 위한 Python과 Git 사용에 대해 중급 수준의 지식 - Python에 대한 중급 수준의 경험 보유

강의내용

대규모 머신러닝

Spark를 활용한 머신러닝 개발
- 머신러닝을 위한 스파크 아키텍처 (Spark Architecture) 간략 개요
- 모델 개발을 위한 스파크 ML 소개
- Databricks에서 MLflow와 Unity Catalog를 활용한 모델 트랙킹 및 패키징
- 스파크를 활용한 모델 개발

Spark에서 Optuna를 활용한 모델 튜닝
- 하이퍼파라미터 (Hyperparameter) 튜닝 개요
- 스파크에서의 Optuna 소개
- Optuna를 활용한 모델 튜닝

고급 머신러닝 운영

Databricks에서의 머신러닝 운영 개요
- MLOps 검토
- 개발에서 배포까지의 간소화

머신러닝 운영을 위한 지속적인 워크플로우
- MLOps 간소화
- Databricks를 활용한 MLOps 간소화

Databricks를 활용한 테스트 전략
- 포괄적인 테스트 자동화
- Databricks를 활용한 모델 롤아웃 전략

모델 품질 및 레이크하우스 모니터링
- 모니터링 소개
- 레이크하우스 모니터링

여러 환경 배포 간소화 – DABs 코드로서의 ML 자산 구축

자주 묻는 질문

Databricks를 활용한 고급 머신러닝 과정은 어떤 내용을 다루나요?
Databricks를 활용한 고급 머신러닝 교육 대상은 누구인가요?
Databricks를 활용한 고급 머신러닝 교육 기간은 얼마나 되나요?
트레이노케이트는 Databricks 공인 교육 기관인가요?