- Iceberg 소개
- DataLake 개념
- Open Lakehouse
- Hive 아키텍처 및 테이블
- Ozone 소개 및 작업
- HDFS와 Ozone 간 데이터 전송
- Ozone 애플리케이션 통합
- Iceberg 아키텍처
- Iceberg Spark, SQL 설정
- Iceberg 카탈로그 검토
- Iceberg 테이블: 관리형 및 외부형
- 테이블 설계 및 연습
- 읽기 및 쓰기를 위한 Iceberg 테이블 튜닝
Day 2
- Schema Evaluation, 마이그레이션 중 Hive와 Iceberg 간의 다양한 데이터 유형 문제 이해
- 숨겨진 파티션: Iceberg 테이블에서 파티션이 작동하는 방식.(Hive와 Iceberg 파티션 비교)
- Time Travel. arious ways of Time Travel and How it helps for testing.
- WAP를 포함한 Data-As-Code - ETL, 분기 및 태그용 -QA 및 ML 테스트를 위한 Zero Copy Clone용
- 유지 관리를 위한 Iceberg 메타데이터.
Day 3
- 변경 데이터 캡처 CDC
- 롤백 데이터
- 마이그레이션 (다양한 Hive to Iceberg 마이그레이션 연습)
- Shallow Migration
- 인플레이스 마이그레이션
- 하이브리드 마이그레이션
Day 4
- 테스트를 위한 스냅샷 마이그레이션
- Late Late-arriving data migration
- RunBook 빌드
- 테이블 유지 관리
- 스트리밍