基于Hadoop的大数据分析和处理

当前位置:首页 > 计算机/网络 > 数据库 > 基于Hadoop的大数据分析和处理

  • 版 次:1
  • 页 数:
  • 字 数:
  • 印刷时间:2017年06月01日
  • 开 本:16开
  • 纸 张:胶版纸
  • 包 装:平装-胶订
  • 是否套装:否
  • 国际标准书号ISBN:9787121317392
作者:魏祖宽 编著出版社:电子工业出版社出版时间:2017年06月 
内容简介
本书基于云计算和大数据,介绍大数据处理和分析的技术,分为两部分。*部分介绍Hadoop基础知识,内容包括:Hadoop的介绍和集群构建、Hadoop的分部式系统架构、MapReduce及其应用、Hadoop的版本特征及进化。第二部分以云计算为主题,详细论述利用Hadoop的大数据分析和处理工具,以及NoSQL技术,内容包括:云计算和Hadoop、Amazon服务中的MapReduce应用、Hadoop应用下的大数据分析、NoSQL、HBase。本书不单纯地讲述理论和概念,而是基于目具体的工具和技术(Hadoop和NoSQL),利用大量实际案例,通过实际的操作和应用来组织大数据处理和分析技术,有利于读者从工程应用的角度进行实际掌握和利用。适合相关专业的本科生、研究生和软件工程师学习。
作者简介
魏祖宽,男,电子科技大学教授,博士,韩国科技协会、中国计算机学会、日本电子电器协会会员。承担计算机以及软件学院的本科和研究生的数据库课程教学和实验教学,及云计算和大数据方面的新课。主持数据库应用、GIS应用等方面的应用课题10多项(国家自然基金委,省/市级科技局等科研项目,以及企业横向项目),现专注于云存储方面的应用科研项目。
目  录
目 录
第1章 Hadoop的介绍和集群构建 2
1.1 Hadoop介绍 2
1.1.1 云计算和Hadoop 2
1.1.2 Hadoop的历史 4
1.2 Hadoop构建案例 6
1.2.1 欧美构建案例 6
1.2.2 韩国构建案例 7
1.3 构建Hadoop集群 8
1.3.1 分布式文件系统 8
1.3.2 构建Hadoop集群的准备事项 12
1.3.3 构建伪分布式 17
1.3.4 分布式集群(Cluster)构建 29
1.4 Hadoop界面 36
前  言
前 言
欧盟的“INFO2000计划”中对内容产业的定义是:那些制造、开发、包装和销售信息产品及其服务的企业,其中包括在各种媒介上的印刷品(报纸、书籍、杂志等);电子出版物(联机数据库、音像制品服务,以传真及光盘为基础的服务以及电子游戏等);音像传播(电视、录像、广播和影院),还有一些定义把部分软件业(包括课程软件)也放进去了。
“在不久未来,信息服务内容的质量高低将取决于如何加工大数据”。
很久以前就已经感觉到,内容(contents),在大部分的服务和产品中,已经成为最重要的决定要素。最初由谷歌出世、最近各家厂商纷纷推出的互联网电视,就是这样一个例子,虽然产品硬件各有特色地优异,但其中最核心的内容提供才是吸引顾客的关键。
问题是,随着互联网技术的急速发展,构建信息内容的数据量也在急速增加。这类量级巨大、急速增加的数据信息我们称为“大数据”。一般来讲,当我们说“信息内容的质量高低取决于如何加工信息大数据”的时候,就意味着优质高效地加工这些信息大数据所对应的软件技术是必需的。

 基于Hadoop的大数据分析和处理下载



发布书评

 
 

 

PDF图书网 

PDF图书网 @ 2017