Training
Contact
News
About Us
Member




Cloudera > Data-Analysts & Scientists

[Cloudera Intensive Course] Admin & Data Warehouse

본 과정은 Cloudera의 핵심 기능을 빠르게 습득할 수 있도록 구성된 4일간의 집중 교육 과정입니다.
Cloudera Manager를 활용한 플랫폼 관리와 Cloudera Data Warehouse를 활용한 데이터 분석을 통합적으로 학습하여, 운영과 분석을 모두 수행할 수 있는 역량을 갖춘 전문가로 성장할 수 있도록 설계되었습니다.

Cloudera Manager를 활용한 플랫폼 설치 및 관리, 그리고 Apache Hive 및 Impala를 활용한 대규모 데이터 분석까지, Cloudera 환경에서 필요한 핵심 역량을 실습 중심으로 익힙니다.

본 과정은 다음 두 개의 Cloudera 공인 과정을 결합하여 구성됩니다:

ADMIN-230: Administering Cloudera On-Premises
Cloudera Manager를 DevOps 도구로 활용하여 플랫폼을 설치, 구성, 운영, 문제 해결, 보고 및 업그레이드하는 방법을 학습합니다. 아키텍처, 배포, TLS/Kerberos 보안 설정, 서비스 관리, 로깅, REST API 등 다양한 기능을 심도 있게 다룹니다.

DANA-262: Analyzing with Cloudera Data Warehouse
Apache Hive 및 Impala를 활용하여 SQL 기반으로 복잡한 데이터셋을 접근, 변환, 분석하는 방법을 학습합니다. 데이터 모델링, 성능 최적화, 복잡/반정형 데이터 처리, 텍스트 분석 등 실무에 바로 적용 가능한 기술을 익힙니다.

3,920,000 원 (VAT별도)

수강대상

데이터 분석 업무를 수행하면서 동시에 플랫폼 관리 역할도 병행해야 하는 실무자
데이터 분석가, BI 전문가, 시스템 관리자, 플랫폼 운영자
Linux 운영 경험 및 SQL 기본 지식 보유자

선수지식

SQL에 대한 기본 지식, Linux 기본 명령어 사용 경험

강의내용

Cloudera Data Platform 아키텍처
- Cloudera Data Platform 아키텍처

Cloudera Manager 아키텍처
- Cloudera Manager 아키텍처

Cloudera Manager 설치
- Cloudera Manager 설치
- 에어갭 저장소 접근
- 저장소 및 RDBMS 구성
- Cloudera Manager 설치

핵심 서비스 설치
- 핵심 서비스 설치
- 에이전트 및 파셀 설치
- CDP 핵심 서비스 설치

Cloudera Manager 탐색
- Cloudera Manager 탐색
- Cloudera Manager 탐색하기
- 내부 관리자 계정 생성

사용자 및 그룹 구성
- 사용자 및 그룹 구성
- Cloudera Manager용 PAM LDAP 구성
- Cloudera Manager 관리자 구성
- Cloudera Manager 역할 구성
- 게이트웨이 호스트 템플릿 생성
- 슈퍼유저 접근 권한 관리

가용성 구성
- 가용성 구성
- 네임노드 고가용성 설치
- 리소스매니저 고가용성 설치
- 하이브서버2 이중화 구성
백업 실행
- 백업 실행
- 플랫폼 백업
- 플랫폼 수동 백업

파셀 설치
- 파셀 설치
- 파셀 설치하기

Cloudera Manager 관리
- Cloudera Manager 관리
- Cloudera Manager 재시작
- 슈퍼바이저 작업
- 클러스터 서비스 자동 재시작 구성

변경 사항 관리
- 변경 사항 관리
- 속성 검색
- HDFS 튜닝을 위한 변경
- YARN 튜닝을 위한 변경

HDFS 이론
- HDFS 이론
- HDFS CLI 실행
- HDFS 점검

YARN 이론
- YARN 이론
- YARN 점검

Apache Hive 및 Impala 소개
- Hive란
- Impala란
- Hive와 Impala를 사용하는 이유
- 스키마 및 데이터 저장
- Hive와 Impala와 전통적인 데이터베이스 비교
- 활용 사례

Apache Hive 및 Impala로 쿼리 실행
- 데이터베이스 및 테이블
- 기본 Hive 및 Impala 쿼리 언어 문법
- 데이터 타입
- Hue를 사용한 쿼리 실행
- Beeline 사용 Hive 셸
- Impala 셸 사용

데이터 관리
- 데이터 저장
- 데이터베이스 및 테이블 생성
- 데이터 로딩
- 데이터베이스 및 테이블 수정
- 뷰를 활용한 쿼리 단순화
- 쿼리 결과 저장

데이터 저장 및 성능
- 테이블 파티셔닝
- 파티셔닝된 테이블에 데이터 로딩
- 파티셔닝 사용 시점
- 파일 포맷 선택
- Avro 및 Parquet 파일 포맷 사용

다중 데이터셋 활용
- UNION 및 조인
- 조인 시 NULL 값 처리
- 고급 조인

분석 함수 및 윈도잉
- 분석 함수 사용
- 기타 분석 함수
- 슬라이딩 윈도우

복합 데이터
- Hive에서 복합 데이터 사용
- Impala에서 복합 데이터 사용

텍스트 분석
- Hive 및 Impala에서 정규 표현식 사용
- Hive에서 SerDes를 활용한 텍스트 데이터 처리
- Hive에서 감성 분석 및 n그램 처리