Storm:大数据流式计算及应用实践

当前位置:首页 > 建筑 > 建筑施工与监理 > Storm:大数据流式计算及应用实践

  • 版 次:1
  • 页 数:
  • 字 数:
  • 印刷时间:2015年03月01日
  • 开 本:16开
  • 纸 张:胶版纸
  • 包 装:平装
  • 是否套装:否
  • 国际标准书号ISBN:9787121195686
作者:丁维龙 等编著出版社:电子工业出版社出版时间:2015年03月 
编辑推荐
  本书结合理论逐步落地实践,使读者不仅能够深入地了解当前大数据带来的挑战和机遇,还可以通过书中的案例获得更直观的感性认识,快速上手Storm的开发,解决个性化实践处理的需求。

 

 
内容简介
  《Storm--大数据流式计算及应用实践/高端云计算与大数据丛书》共分为三篇,第一篇从流式计算的原理入手,论述了大数据环境下的挑战及流式计算的基本理论与技术;第二篇详细讲解了开源工具Storm实现的大数据流式处理的基础,包括Storm的系统架构、通信模型、作业单元、数据源编程单元、数据处理编程单元、功能性保障、非功能性保障、分布式远程过程调用、事务性作业、非.Java语言的开发等;第三篇系统性地总结了Storm的应用实践流程,以实际案例为例,讲解了Stollll的系统部署、开发、调试,并分析了笔者参与的一个实际项目。
    本书结合理论逐步落地实践,使读者不仅能够深入地了解当前大数据带来的挑战与机遇,还可以通过书中的案例获得更直观的感性认识,快速上手Storm的开发,解决个性化实践处理的需求。本书编纂严谨,非常适合业界专业人士基于Storm进行大数据流式处理编程与实践,也适合高等院校学生以Storm为参照系统,自学分布式流式数据处理技术。
作者简介
  丁维龙,博士,2013 年1 月毕业于中国科学院计算技术研究所,现任教于北方工业大学,在大规模流数据集成与分析技术北京市重点实验室从事实时数据处理与分布式系统方向的研究,已在SCI 检索期刊和领域知名国际会议发表多篇学术论文,主持并参与多项科研课题。中国计算机学会(CCF)、ACM(Association for Computing Machinery)会员,目前是旗舰期刊IEEE Transaction on Service Computing、 IEEE Transactions onIndustrial Informatics 和计算机学报审稿人,同时担任第七届中国传感器网络学术会议(The 7th China Conference on China Wireless Sensor Networks, CCF CWSN2013)、IEEE SDPI workshop 的程序委员会成员。
目  录
第一篇 理论篇 流式数据处理概论
第1章 大数据环境下的云计算与物联网
1.1 云计算与物联网
1.1.1 云计算
1.1.2 物联网
1.2 大数据下的新挑战
1.2.1 大数据及其特征
1.2.2 大数据处理的技术挑战
1.3 本章小结
第2章 流式实时数据处理:理论与技术
2.1 流式数据与流式实时计算
2.1.1 流式数据
2.1.2 流式实时计算
2.2 流式数据处理的系统与应用
前  言
  信息技术行业在过去的不长时期内,经历了多种概念的出现、发展和消亡。而当今,最火热的IT词汇,无外乎“大数据”、“云计算”和“物联网”;而相应的支撑技术,诸如Hadoop、HDFS和Cassandra等,均得到了广泛关注和研究。特别是以Hadoop生态系统为代表的大规模数据处理技术,已经成为业界事实上的标准之一。但是,Hadoop/MapReduce这类数据处理技术和所构建的分布式系统,针对数据边界清晰的数据进行批处理操作,涉及作业的启动、中间结果写盘缓存和共享存储模式的数据传输,使得数据处理结果存在较长延迟,无法提供持续处理的能力。基于Hadoop/MapReduce计算框架的系统,可针对大规模数据实现批处理,但在高速并发的环境下,无法满足实时、连续处理的需求。于是,编程标准化、可靠和可伸缩的数据处理的计算模型和框架,成为实时数据处理生态系统的一个巨大缺失,而从Twitter公司开源的Storm,恰好填补了这个空白。
  Storm作为开源的实时数据处理系统,较之实时计算领域如同批数据处理领域的Hadoop,不仅降低了数据处理的并行编程的复杂度,也提供了数据不丢失的保证和集群节点动态部署的特性。具体来说,Storm的关键特性如下。

 Storm:大数据流式计算及应用实践下载



发布书评

 
 

 

PDF图书网 

PDF图书网 @ 2017