- 모델 성능 평가
- 하이퍼파라미터 튜닝 기초 (Hyperparameter Tuning Fundamentals)
- Hyperopt를 활용한 하이퍼파라미터 튜닝
- AutoML을 활용한 자동화된 모델 개발
이 포괄적인 과정은 Databricks에서 전통적인 머신러닝 모델을 개발하는 실용적인 가이드를 제공하며, 널리 사용되는 ML 라이브러리를 활용한 실습 데모와 워크플로우에 중점을 둡니다. 참가자들은 Databricks의 강력한 기능을 활용하면서 회귀 및 클러스터링을 포함한 핵심 머신러닝 기법을 탐구하게 됩니다. 본 과정에서는 모델 추적을 위한 MLflow 통합, 특징 관리용 Databricks 특성 저장소, 하이퍼파라미터 튜닝용 Optuna를 다룹니다. 또한 참가자들은 Databricks AutoML을 통해 모델 훈련을 가속화하는 방법을 배우게 됩니다. 과정이 끝날 무렵, 학습자들은 Databricks 환경에서 머신러닝 모델을 효율적으로 개발, 최적화 및 배포할 수 있는 실제적이고 실용적인 기술을 습득하게 됩니다.
머신러닝의 기본 개념 이해 (예: 회귀 모델 vs 분류 모델), Databricks 워크스페이스 및 노트북 사용 경험, Python 중급 수준의 지식, 머신러닝 라이브러리 기본 지식 (예: scikit-learn), Unity catalog 및 MLflow 사용 경험은 우대 사항
- 머신러닝 모델 개발의 기본 개념 설명
- 모델 개발을 위한 MLflow의 주요 구성 요소 설명
- 하이퍼파라미터 튜닝 설명 및 HPO 태스크에 Optuna 활용
- 모델 추적 및 모델 개발을 위한 MLflow 활용
- AutoML 실험 실행, 선호 지표 기반 모델 식별, 생성된 모델 수정을 위한 AutoML API 및 Databricks UI 활용