从零开始学Storm(第2版)

当前位置:首页 > 计算机/网络 > 行业软件及应用 > 从零开始学Storm(第2版)

  • 版 次:2
  • 页 数:
  • 字 数:
  • 印刷时间:2016年06月11日
  • 开 本:16开
  • 纸 张:胶版纸
  • 包 装:平装
  • 是否套装:否
  • 国际标准书号ISBN:9787302438076
作者:赵必厦、程丽明出版社:清华大学出版社出版时间:2016年06月 
编辑推荐
本书是作者理论研究与实践操作的成果,较深入的探讨了Storm的理论基础与实践应用,语言通俗易懂,适用于各类大数据、Storm开发者,爱好者。使读者在较短的时间内系统掌握Storm的理论基础,面向Linux平台,搭建与研发自己的基于Storm的大数据处理平台。
 
内容简介
本书由基础知识、安装与部署、研发与维护、进阶知识、企业应用5个模块构成,并细分为20个章节,其中“基础知识”6章、“安装与部署”4章、“研发与维护”4章、“进阶知识”5章、“企业应用”1章,分别介绍了Storm的基本原理、Topology组件、Spout组件、Bolt组件、ZooKeeper集群、Storm的安装与配置、实战环节等内容,包括理论基础、环境搭建、研发准备、企业应用等。 本书理论联系实际,通过大量实例分析,让读者在较短的时间内掌握Storm的使用,搭建并研发出自己的基于Storm的大数据处理平台。 本书适合所有大数据处理、实时流数据处理、Storm的开发者或爱好者,也适合高等院校和培训学校相关专业的师生参考使用。
作者简介
赵必厦,硕士,具有多年的面向对象语言研发经验,熟练掌握C 、Java、C#等面向对象语言,专注于云计算、大数据、互联网等方面的研究与研发工作,积累了丰富的经验。程丽明,硕士,目前从事服务器虚拟化与云计算构建、信息化安全的研究和产品开发工作。有多年的项目开发经验,研究兴趣包括虚拟化、云计算、SDN、移动办公安全等。
目  录
目 录


第1章 Storm简介
1.1 什么是Storm 1
1.2 Storm的诞生 3
1.2.1 从Twitter说起 3
1.2.2 Twitter需要处理大批实时性要求高的大数据业务 3
1.2.3 Storm帮助Twitter解决实时海量大数据处理问题 4
1.3 Storm的成长 5
1.3.1 Storm正式开源5
1.3.2 Apache接管并孵化Storm 5
1.3.3 Storm的核心技术和基本组成 6
1.3.4 Storm的项目小组7
前  言
前 言



Storm是一个免费开源的分布式实时计算系统。Storm能够轻松可靠地处理无界的数据流,就像Hadoop对数据进行批处理;但是Storm能持续运作下去,并且Storm的使用十分简单,开发人员可以使用任何编程语言对它进行操作,得到满意的结果。
在线试读部分章节
第 5 章
? Spout详解 ?


Spout是Storm数据流的入口。在这一章,将学习Storm数据流的入口点——Spout。通过本章,应该掌握Storm获取数据的方式和方法,了解常用的Spout,学会如何编写Spout类。
5.1 可靠的与不可靠的消息
设计拓扑时,一件很重要的事情是要考虑消息的可靠性。如果消息不能被处理而丢失是很严重的问题,我们需要决定如何处理丢失的消息,如何与拓扑作为一个整体处理。例如,处理银行存款的时候,事务一致性是很重要的,不能失去任何消息,任何消息都要被处理。又例如,在数以百万计的数据中计算某些统计指标,但是丢失了少量的数据,最终的计算指标仍然可以假设是相当准确的。
在Storm中,根据每个拓扑的需要,保证信息可靠性,这涉及一个平衡:一个可靠的拓扑必须处理丢失的消息,这就需要更多的资源;一个不可靠的拓扑可能会丢失一些消息,但不占用资源。不管你选择哪一种可靠性策略,Storm都可以提供工具来实现它。
为了管理Spout的可靠性,可以在发射元组的时候,在元组里面包含一个消息ID(collector.emit(new Values(…),tupleId))。
当元组处理成功时调用ack()方法,当元组处理失败时调用fail()方法。当元组被所有的目标Bolt和所有的锚定Bolt所处理时,认为元组处理成功。当如下情况发生时,元组处理会失败:
l collector.fail(tuple)方法被目标Spout调用。
l 处理时间超过配置的超时时间。
下面,让我们来看Getting Started with Storm一书中的例子,关于其完整的代码,可以参考如下网址:
https://github.com/storm-book/examples-ch04-spouts/tree/master/src/main/
书摘插画
插图

 从零开始学Storm(第2版)下载



发布书评

 
 

 

PDF图书网 

PDF图书网 @ 2017