第1章 初识Hadoop
1.1 为什么要学习Hadoop
1.1.1 信息化项目衍生过程
1.1.2 Hadoop产生过程
1.1.3 Hadoop成功案例介绍
1.2 Hadoop与云计算的关系
1.2.1 什么是云计算
1.2.2 云计算演进历史
1.2.3 云计算相关技术介绍
1.2.4 Hadoop在云项目中扮演的角色
1.3 Hadoop与大数据的关系
1.3.1 什么是大数据
1.3.2 大数据的存储结构
1.3.3 大数据的计算模式
1.3.4 Hadoop在大数据中扮演的角色
1.4 学习Hadoop需要具备的知识基础
1.5 学习Hadoop需要的实验环境
1.6 Hadoop的用途
1.7 小结
第2章 Hadoop基础知识
2.1 Hadoop简介
2.1.1 Apache Hadoop项目核心模块
2.1.2 Apache Hadoop项目的其他模块
2.2 Hadoop版本演化
2.3 RPC工作原理
2.3.1 RPC简介
2.3.2 Hadoop中的
2.3.3 RPCoIB和JVM-旁路缓冲管理方案:在高性能网络InfiniBand上数据交换的改进
2.4 MapReduce工作原理
2.4.1 MapReduce计算模型
2.4.2 MapReduce经典案例
2.4.3 MapReduce应用场景
2.5 Hadoop改进
2.5.1 LATE算法:良好的适应异构性环境
2.5.2 Mantri:MapReduce异常处理
2.5.3 SkewTune:MapReduce中数据偏斜处理
2.5.4 基于RDMA的MapReduce设计:提升大数据应用的性能和规模
2.6 HDFS工作原理
2.6.1 HDFS介绍
2.6.2 HDFS体系结构
2.6.3 文件系统的命名空间
2.6.4 HDFS中Block副本放置策略
2.6.5 HDFS机架感知
2.6.6 HDFS安全模式
2.6.7 HDFS应用场景介绍
2.6.8 混合HDFS的设计:充分利用硬件能力获得最佳性能
2.7 YARN工作原理
2.7.1 YARN on HDFS的工作原理
2.7.2 MapReduce on YARN的工作原理
2.8 容错机制
2.9 安全性
2.10 小结
第3章 Hadoop开发环境配置与搭建
第4章 Hadoop分布式文件系统
第5章 Hadoop的I/O操作
第6章 MapReduce编程基础
第7章 MapReduce高级编程
第8章 初识HBase
第9章 初识Hive
附录 《Hadoop集群程序设计与开发》配套实验课程方案简介