Cloudera > Admin

ADMIN-230: Administrating Cloudera Data Platform

과정명이 변경되었습니다
기존 : Administrator Training: CDP Private Cloud Base
변경된 과정명 : ADMIN-230: Administrating Cloudera Data Platform

CDP(Cloudera Data Platform)는 엣지 투 AI 제품 세트에 완전히 통합됩니다. Cloudera Manager는 Cloudera Data Platform을 구축하고 관리하기 위한 DevOps 툴로 특별히 구축되었습니다. 이 4일간의 실습 과정에서는 성공적인 플랫폼 관리를 위한 자세한 설명, 포괄적인 이론, 핵심 기술 및 권장 사례를 제공합니다. 이 과정을 이수하면 CDP 관리자는 Cloudera Data Platform을 지원하는 Cloudera Manager의 모든 기능을 배우게 됩니다.

이 과정에서는 Cloudera Manager 및 Cloudera Data Platform을 사용하여 생산성을 높일 수 있는 심층적인 설명과 기술을 제공합니다. Cloudera Manager는 모든 기능을 갖춘 완성도 높은 DevOps 도구입니다. CDP를 설치, 구성, 작동, 문제 해결, 보고 및 업그레이드하는 데 사용됩니다. 많은 CDP 관리자는 Cloudera Manager에 내장된 기능 중 일부만 사용합니다. 이 과정에서는 아키텍처, 배포, 구성, 로깅, 보고, REST API 등을 가르칩니다. 이 과정은 전 세계 기업에서 사용하는 아키텍처 및 권장 사례에 대한 참조를 제공합니다

2,853,000 원 (면세)

수강대상

데이터 관리자, 시스템 관리자

선수지식

리눅스 기본 사용 CDP 또는 Cloudera의 CDH 또는 Hortonworks HDP와 같은 이전 플랫폼에 대한 사전 지식은 필요하지 않습니다.

교육목표

본 과정을 수료하면 아래의 교육 목적을 달성할 수 있습니다.
- Cloudera Manager 설치
- Cloudera Manager를 사용하여 CDP Private Cloud Base 클러스터 설치
- Cloudera Manager를 사용하여 클러스터 구성 및 모니터링
- 가장 적합한 데이터 스토리지 옵션을 이해, 평가 및 선택
- 클러스터 성능 최적화
- 일상적인 클러스터 유지 관리 작업 수행
- 클러스터 문제 감지, 문제 해결 및 복구 데이터 흐름 최적화 방법과 사용 가능한 모니터링 및 리포트 기능 구현

강의내용

1. Cloudera 데이터 플랫폼
-빅 데이터 업계 동향
-Data-Driven이 되기위한 도전
-엔터프라이즈 데이터 클라우드
-CDP 개요
-CDP 폼 팩터

2. CDP Private Cloud base 설치
-설치 개요
-Cloudera Manager 설치
-CDP 런타임 개요
-Cloudera Manager 소개

3. 클러스터 구성
-개요
-구성 설정
-서비스 구성 수정
-구성 파일
-역할 인스턴스 관리
-새로운 서비스 추가
-호스트 추가 및 제거

4. 데이터 스토리지
-개요
-HDFS 토폴로지 및 역할
-HDFS 성능 및 내결함성
-HDFS 및 Hadoop 보안 개요
-HDFS 작업
-HBase 개요
-Kudu 개요
-클라우드 스토리지 개요

5. 데이터 수집
-데이터 수집 개요
-파일 형식
-파일 전송 또는 REST 인터페이스를 사용하여 데이터 수집
-Apache Sqoop을 사용하여 관계형 데이터베이스에서 데이터 가져 오기
-NiFi를 사용하여 데이터 수집
-데이터 가져 오기 모범 사례

6. 데이터 흐름
-Cloudera Flow Management 및 NiFi 개요
-NiFi 아키텍처
-Cloudera Edge 흐름 관리 및 MiNiFi
-컨트롤러 서비스
-Apache Kafka 개요
-Apache Kafka 클러스터 아키텍처
-Apache Kafka 명령 줄 도구

7. 데이터 액세스 및 검색
-Apache Hive
-Apache Impala
-Apache Impala 조정
-검색 개요
-Hue 개요
-Hue 관리 및 구성
-Hue 인증 및 승인
-CDSW 개요

8. 데이터 컴퓨팅
-YARN 개요
-YARN에서 애플리케이션 실행
-YARN 애플리케이션보기
-YARN 애플리케이션 로그
-MapReduce 애플리케이션
-YARN 메모리 및 CPU 설정
-Tez 개요
-Tez의 하이브
-Hive 용 ACID
-Spark 개요
-Spark 애플리케이션이 YARN에서 실행되는 방법
-Spark 애플리케이션 모니터링
-Phoenix 개요

9. 자원 관리
-CPU 스케줄링으로 cgroup 구성
-용량 스케줄러
-대기열 관리
-Impala 쿼리 예약

10. 클러스터 계획하기
- 일반적인 고려 사항
-올바른 하드웨어 선택
-네트워크 고려 사항
-CDP 사설 클라우드 고려 사항
-노드 구성

11. 고급 클러스터 구성
-서비스 포트 구성
-HDFS 및 MapReduce 조정
-클러스터 증가 관리
-이레이저 코딩
-HDFS 고 가용성 활성화

12. 클러스터 유지 관리
-HDFS 상태 확인
-클러스터 간 데이터 복사
-HDFS에서 데이터 재조정
-HDFS 디렉토리 스냅 샷
-호스트 유지 관리
-클러스터 업그레이드

13. 클러스터 모니터링
-Cloudera Manager 모니터링 기능
-건강 테스트
-이벤트 및 경고
-차트 및 보고서
-권장 사항 모니터링

14. 클러스터 문제 해결
-개요
-문제 해결 도구
-잘못된 구성 예

15. 보안
-SDX를 통한 데이터 거버넌스
-Hadoop 보안 개념
-Kerberos를 사용한 Hadoop 인증
-Hadoop 인증
-Hadoop 암호화
-Hadoop 클러스터 보안
-아파치 레인저
-Apache Atlas
-백업 및 복구

16. 프라이빗 클라우드 / 퍼블릭 클라우드
-CDP 개요
-사설 클라우드 기능
-퍼블릭 클라우드 기능
-Kubernetes 란 무엇입니까?
-WXM 개요
-자동 확장



기타

권장되는 다음 교육 과정 ADMIN-332: Building Secure Cloudera Clusters