· 학습 목표
AWS를 활용한 빅데이터 파이프라인 구축을 위한 데이터 수집, 전처리, 저장, 스트리밍, 분석 기술 및 Amazon Glue, EMR, S3, Kinesis Firehose 등의 활용법을 합니다.
· 주요 내용
1. AWS를 활용한 빅데이터 데이터 파이프라인 이해
2. 다양한 데이터 소스로부터 데이터 수집(정형/비정형/반정형/실시간 데이터) 전송
3. Amazon Glue - Crowler, Job 모듈 및 EMR를 활용한 데이터 수집
4. AWS S3 저장과 지능형 계층화 아카이브 구성
5. 빅데이터 스트리밍과 Amazon Kinesis Firehose
6. 빅데이터 전처리와 분석 기법
[Chapter2. AWS 빅데이터 저장/처리]
· 학습 목표
AWS 빅데이터 저장/처리에서 NoSQL과 RDBMS 활용 차이, 데이터 형식 및 저장 시스템, Glue Studio 전처리, Lambda Trigger 및 S3, Kinesis 연동, NoSQL 데이터 저장을 합니다.
· 주요 내용
1. NoSQL과 RDBMS의 차이 및 활용
2. 데이터 타입, 저장 형식, 카테고리 별 저장 시스템
3. HDFS, HDFS EC, Azure BLOB, ADLS, S3, DynamoDB, RedShift 이해 및 활용
4. AWS Glue Studio를 이용한 데이터 전처리
5. Lambda Trigger 활용 및 S3와 Kinesis 연동
6. NoSQL(Cosmos, Cassandra, DynamoDB)를 활용한 데이터 저장

