Hadoop实战案例培训(Cloudera)

Hadoop实战案例培训(Cloudera)

课程长度:10天/60小时 培训对象: 企业管理者、CIO、CTO、政府信息部门官员、项目(开发)经理、顾问;IT经理,IT顾问,IT支持专家;系统工程师、数据中心管理员、

授课机构: 大数据时代培训中心

上课地点: 天河校区

开设班型:早班,晚班,周末班

费用:
获取报价
89人已关注关注
预约试听
在线咨询
Apache Hadoop管理员培训
Apache Hadoop管理员培训
剩余名额:2个开班提醒
Apache Hadoop开发者培训
Apache Hadoop开发者培训
剩余名额:2个开班提醒
Apache HBase专家培训
Apache HBase专家培训
剩余名额:2个开班提醒
Cloudera Hadoop数据分析员培训
Cloudera Hadoop数据分析员培训
剩余名额:2个开班提醒
课程介绍

课程长度:10天/60小时

培训对象:
企业管理者、CIO、CTO、政府信息部门官员、项目(开发)经理、顾问;IT经理,IT顾问,IT支持专家;系统工程师、数据中心管理员、云计算管理员及想加入云计算队伍的您。

学员基础:
计算机相关专业;具备基本Linux系统管理经验;具备编程经验的开发人员;熟悉Java;不需要事先掌握Hadoop相关知识

课程目标:
通过考试可获得Cloudera Certified Administrator for Apache Hadoop (CCAH) ;Cloudera Certified Developer for Apache Hadoop (CCDH) 证书

 

培训内容:

主题

内容

Hadoop基础

 

初识Hadoop及其分布式文件系统
【主要内容】Hadoop是什么,Hadoop可以做什么,Hadoop的分布式文件系统(HDFS)及其特点,HDFS如何承载应用

 

搭建伪分布式的Hadoop环境
【主要内容】如何利用一台Linux机器搭建你的个Hadoop环境?如何从Hadoop的日志中发现它的故障、异常等

 

开发你的个MapReduce程序
【主要内容】函式编程与MapReduce,MapReduce程序的主题结构,在Eclipse上搭建MapReduce开发环境,如何运行你的MapReduce程序,用ANT自动化MapReduce程序的部署

 

在企业内网中快速搭建真正分布式的Hadoop环境
【主要内容】如何在企业内网中快速搭建一个真正的分布式的Hadoop环境?涉及YUM源,部署脚本等。

 

HIVE基础与实践
【主要内容】HIVE的架构和实现方式,HIVE Metastore的类型和实现方式,HQL语言基础,如何用HIVE做大数据分析等

 

深入解析HDFS

深度解析HDFS系统配置
【主要内容】HDFS及Linux中与HDFS相关的配置项详解,常用的HDFS必配项及其在实践中的设置方法

 

玩转HDFS
【主要内容】如何管理和维护HDFS,查找HDFS的基本命令,如何获取帮助,HDFS中的两个较常用命令集——dfs和dfsadmin

 

深度解析HDFS的五大关键特性
【主要内容】EditLog、Checkpoint、Rebalance、Rack Awareness和Replication

 

深度解析HDFS的读写过程和性能优化
【主要内容】HDFS在文件读写过程(结合HDFS源代码),HDFS的租约机制与无锁读写特性,如何从操作系统、磁盘、文件系统和网络等几个层面来优化的HDFS性能

 

Trouble Shooting HDFS
【主要内容】HDFS的常见问题,Namenode的常见问题及其处理方法,元数据损坏时如何恢复,Datanode的常见问题及其处理方法

 

深入浅出Zookeeper
【主要内容】Paxos与Google的分布式协同机制,Chubby与Zookeeper,Zookeeper的原理、部署方法和应用技巧

 

Hadoop HA理论与实践
【主要内容】Hadoop HA的前世今生,Hadoop HA中是否存在数据丢失的风险,Hadoop2中的两种HA方式——QJM和NFS,QJM方案配置演示

 

HDFS RAID与HttpFS
案例分析:制作基于HDFS的对象存储

 


深入解析MapReduce

深度刨析JobTracker和TaskTracker
【主要内容】JobTracker和TaskTracker的工作原理详解

 

MapReduce经典案例刨析与开发思想
【主要内容】函式编程的回顾与深化,MapReduce典型程序分析:Wordcount、Top-k与Join

 

定制你的MapReduce
【主要内容】Inputformat、OutputFormat和Partitioner等

 

让MapReduce程序飞速运行(一)
【主要内容】深度解析Split、Sort、Shuffling、Merge四大MapReducce程序执行过程中所经历的四大关键过程,如何利用这4大过程来优化MapReduce程序

 

让MapReduce程序飞速运行(二)
【主要内容】Combiner原理及其在MapReduce中的作用,MapReduce实际案例分析

 

MapReduce程序开发的高级技巧
【主要内容】用Python等第三方语言快速编写MapReduce程序、自动串接多个Mapper和Reducer、容忍一定程度的失败任务和错误记录等

 

进一步玩转MapReduce的平台级优化
【主要内容】MapReduce程序的主要性能瓶颈及各种“坑”,MapReduce的主要性能配置项及其配置方法

 

YARN和MRv2选讲
案例分析:挖掘运营商中的大数据