产品特色
内容简介
准备好释放数据的威力了吗?通过这本施工忸怩好,你将会学习到如何通过Apache Hadoop建立和维护可靠的、可扩展的分布式系统。本书是期望分析任意大小的数据集的程序员以及想建立和运行Hadoop集群的管理员的理想选择。
在这本面向Hadoop 2的新版书籍中,作者怀特增加了关于YARN和一些Hadoop相关项目,如Parquet、Flume、Crunch和Spark的新章节。你将会了解到Hadoop版本的新变化,并且研究在医疗健康系统和基因数据处理中Hadoop的应用案例。
目录
Foreword
Preface
Part Ⅰ.HadoopFundamentals
1.Meet Hadoop
2.MapReduce
3.The Hadoop Distributed Filesystem
4.YARN
5.Hadoop I/O
Part Ⅱ.MapReduce
6.Developing a MapReduce Application
7.How MapReduce Works
8.MapReduce Types and Formats
9.MapReduce Features
Part Ⅲ.HadoopOperations
10.Setting Up a Hadoop Cluster
11.Adminstering Hadoop
Part Ⅳ.Related Projects
12.Avro
13.Parquet
14.Flume
15.Sqoop
16.Pig
17.Hive
18.Crunch
19.Spark
20.HBase
21.ZooKeeper
Part Ⅴ.Case Studies
22.Composable Data at Cerner.
23.Biological Data Science: Saving Lives with Software
24.Cascading
A.Installing Apache Hadoop
B.Cloudera's Distribution Including Apache Hadoop
C.Preparing the NCDC Weather Data
D.The Old and New Java MapReduce APIs
Index
前言/序言
Hadoop权威指南(影印版第4版 修订版 英文版) 电子书 下载 mobi epub pdf txt