Hadoop生态系统

当前位置:首页 > 计算机/网络 > 软件工程/开发项目管理 > Hadoop生态系统

  • 版 次:1
  • 页 数:
  • 字 数:
  • 印刷时间:2016年10月01日
  • 开 本:16开
  • 纸 张:胶版纸
  • 包 装:平装
  • 是否套装:否
  • 国际标准书号ISBN:9787512395985
作者:Kevin Sitto出版社:中国电力出版社出版时间:2016年10月 
编辑推荐

如果你的组织即将开始进入大数据的世界,那么可能不仅需要决定Apache Hadoop这个平台是否适合使用,还需要决定Hadoop中哪些组件*适合完成你的任务。本书将帮助你更容易地完成这项工作。本书将Hadoop的生态系统分解为一个个简略的、容易理解的小段内容,以便读者可以快速理解Hadoop项目、子项目及其相关技术是如何一起工作的。

 
内容简介
本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。
主要包括如下主题:
核心技术。Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。
数据库和数据管理。Cassandra、HBase、MongoDB和Hive。
序列化。Avro、JSON和Parquet。
管理和监视。Puppet、Chef、Zookeeper和Oozie。
分析辅助。Pig、Mahout和MLLib。
数据传输。Scoop、Flume、distcp和Storm。
作者简介

 Kevin Sitto是Pivotal Software公司的领域解决方案工程师,主要为客户提供咨询服务,帮助客户理解和描述大数据需求。

Marshall Presser是Pivotal Data Engineering集团的成员。他帮助客户使用Hadoop、关系数据库和内存数据网格来解决复杂的分析问题。

目  录
前言 1
第1章关键技术 7
11 Hadoop分布式文件系统(HDFS) 8
12 MapReduce 11

13 YARN 13

14 Spark 15

第2章数据库及数据管理 17
21 Cassandra 19

22 HBase 21

 Hadoop生态系统下载



发布书评

 
 

 

PDF图书网 

PDF图书网 @ 2017