热门排行
简介
Hadoop源代码分析 第2版(修订版)是一本全面细致介绍和分析Hadoop源码和内部工作机理的技术书籍,通过对Hadoop内部源码详细透彻的解析,使读者能够快速高效地掌握Hadoop的内部工作机制,了解Hadoop内部源码架构,对Hadoop有更加深刻的认识。
本书主要对Hadoop最核心的部分:HDFS和MapReduce进行源码解析和说明。适合所有想全面学习Hadoop开发技术的人员阅读,也适用于使用Hadoop进行开发的工程技术人员,还可作为想深入了解Hadoop运行机制、源代码的开发人员的参考书籍。
目录
第1篇 Hadoop概述与安装
第1章 Hadoop的简介和安装
第2篇 HDFS分布式文件系统及IO模型
第2章 HDFS架构和分布式文件系统
第3章 Hadoop分布式文件系统HDFS的具体实现
第4章 NameNode的实现
第5章 Datanode的实现
第6章 Hadoop的IO
第3篇 MapReduce计算框架及RPC通信模型
第7章 MapReduce的输入和输出
第8章 Hadoop中的Context和ID
第9章 Hadoop的计算模型MapReduce
第10章 JobClient的执行过程分析
第11章 JobTracker的执行过程分析
第12章 Hadoop的作业调度器
第13章 TaskTracker的执行过程
第14章 Hadoop的RPC协议