R高性能编程

当前位置:首页 > 计算机/网络 > 程序设计 > R高性能编程

  • 版 次:1
  • 页 数:
  • 字 数:
  • 印刷时间:2015年12月01日
  • 开 本:16开
  • 纸 张:胶版纸
  • 包 装:平装
  • 是否套装:否
  • 国际标准书号ISBN:9787121273964
作者:Aloysius Lim(阿洛伊修斯·利姆) William Tjhi(威廉姆· Tjhi) 著,唐李洋 译出版社:电子工业出版社出版时间:2015年12月 
编辑推荐
  从本书你将学到什么
  √ 对R程序进行基准测试和性能分析以解决性能瓶颈
  √ 理解CPU、内存和磁盘I/O是如何限制R程序的性能的
  √ 优化R代码使其运行更快并消耗更少内存
  √ 在R中使用编译代码和C这样的其他语言以加快计算速度
  √ 利用GPU提升计算速度
  √ 使用基于磁盘的内存和块技术处理超过内存容量的数据集
  √ 通过并行计算接入多个CPU
  √ 在R中利用高级数据库系统和大数据工具
  这本书的读者是谁
  这本书可以帮助那些想要提升R程序性能的程序员和开发者,使R程序在处理大型数据集的时候运行更快;也适合那些试图解决某个讨厌的性能问题的程序员和开发者。 
内容简介
  本书对R语言做了简要描述,配以大量编程实践和代码样例,适合于想要提高R语言性能的程序员和开发者,对大量数据的处理、R语言的实际应用、基准测试均有指导意义。现代社会面对越来越庞大的数据和数据分析,R语言正是分析和处理大数据的有效方式,本书正是全面解析R语言的优秀书目。
作者简介
  Aloysius Lim
  擅长将复杂的数据和模型表述为简单易懂的见解。作为About People的联合创办者、数据科学家及设计顾问,他喜欢解决问题,以及帮助他人寻找利用数据解决业务难题的实践方案。在政府、教育和零售行业长达7年的丰富经验,造就了他寻找具有创造性的解决办法的独特视角。
衷心地感谢上帝给我机会撰写本书,让我分享这些知识。在这个过程中,我亲爱的妻子Bethany给予了极大的支持和鼓励。谢谢你全部的爱,亲爱的。非常感谢我的搭档William,他是我灵感和洞察力的来源。
  William Tjhi
  数据科学家,在学术、政府及工业界具有多年的工作经验。他自读博期间开始了数据科学之旅,研究了一些新算法以提高高维数据聚类的健壮性。取得博士学位之后,他从基础研究转向了应用研究,致力于采用机器学习方法解决分子生物学和传染病学中的各种问题。他在一些同行评审的期刊和会议上发表了部分研究成果。随着大数据的兴起,William离开了学术界,转而投入工业界,开始了商业和公共部门领域的数据科学实践。   William热衷于R,从他搞研究的那天开始就一直使用R作为主要的分析工具。他曾经是Revolution Analytics的一员,那时候他做了很多使R更加适合大数据的贡献。
目  录
前言 X
1 理解R的性能:为什么R程序有时候很慢? 1
计算性能的三个限制因素:CPU、RAM和磁盘I/O 2
R是运行时解释的 4
R是单线程的 5
R需要将全部数据加载到内存 5
算法设计影响时间和空间复杂度 6
小结 9
2 性能分析:衡量代码的性能 11
衡量总运行时间 11
使用system.time()衡量运行时间 12
使用rbenchmark重复衡量运行时间 13
使用microbenchmark衡量运行时间的分布 15
分析运行时间 16
前  言
  前言
  随着数据越来越重要,商家和科学家们也越来越需要高效分析和处理大规模数据的工具。近年来,R这一工具越来越普遍地应用于数据处理、统计分析和数据科学。虽然R*初源自学术界,但如今已经被工业界各个组织广泛使用。
  然而,由于R本身的设计问题,它能够有效处理的数据规模和计算复杂度有限。这对于需要处理日益增长的大规模数据的R用户来说,是个极大的障碍。
  《R高性能编程》这本书有助于理解R的性能难题,比如内存和计算方面的限制。本书还给出了很多克服这些难题的技术。你可以根据需求和计算环境选择其中一种技术或者混合使用不同的技术。
  这本书是关于如何提升R程序性能的实用指南,并适当地解释了使你能够理解每一个解决方案背后的原因。同样,对于本书提到的每一个技术我们都提供了代码示例,以及在我们的机器上生成的性能分析结果以展示性能的提升情况。我们建议大家根据自己的实际环境敲写和运行这些代码,然后自己看看性能提升情况。
  如果想要知道R的设计原理并理解其性能限制的原因,R内部文档(http://cran. r-project.org/doc/manuals/r-release/R-ints.html)中提供了有用的线索。
媒体评论
随着商业界和科学界各个领域对信息的使用越来越多,R提供了一种简单、强大的方法以分析和处理超大规模数据。R是快速进行数据探索、统计分析和统计建模*常用的工具之一,能够从大规模的数据中得到有用的洞见和发现。

通过这部实践指南,你将学到很多解决R编程性能问题的方法。你将学习如何对R程序进行性能分析和基准测试,识别瓶颈,评估和识别CPU的性能限制,识别内存或磁盘I/O的局限性,以及使用诸如计算向量化这样的技巧来优化R程序的计算速度。你还会学到更高级的技术,比如编译代码、利用GPU的计算能力、优化内存消耗,以及通过基于磁盘的内存和块技术处理超过内存容量的数据集。

 R高性能编程下载



发布书评

 
 

 

PDF图书网 

PDF图书网 @ 2017