这就是搜索引擎:核心技术详解(搜索引擎相关技术 核心算法 云计算 云存储 搜索引擎优化)

当前位置:首页 > 社会科学 > 图书馆学/档案学 > 这就是搜索引擎:核心技术详解(搜索引擎相关技术 核心算法 云计算 云存储 搜索引擎优化)

  • 版 次:1
  • 页 数:
  • 字 数:
  • 印刷时间:2012年01月01日
  • 开 本:16开
  • 纸 张:轻型纸
  • 包 装:平装
  • 是否套装:否
  • 国际标准书号ISBN:9787121148651
作者:张俊林 著出版社:电子工业出版社出版时间:2012年01月 
编辑推荐

推荐购买:

《ZeroMQ:云时代极速消息通信库》

《从Paxos到Zookeeper:分布式一致性原理与实践》

《大数据日知录:架构与算法》

《Apache Spark源码剖析》

《ElasticSearch:可扩展的开源弹性搜索解决方案》

《Spark大数据处理技术》

《Hadoop硬实战》

《寻路大数据:海量数据与大规模分析》


《这就是搜索引擎:核心技术详解》适合所有对搜索引擎技术感兴趣的人们,尤其对于相关领域的学生、对搜索引擎核心技术感到好奇的技术人员、从事搜索引擎优化的相关人员及中小网站站长等更有参考价值。
本书作者其他著作《大数据日知录:架构与算法》




 
内容简介

  搜索引擎作为互联网发展中至关重要的一种应用,已经成为互联网各个领域的制高点,其重要性不言而喻。搜索引擎领域也是互联网应用中不多见的以核心技术作为其命脉的领域,搜索引擎各个子系统是如何设计的?这成为广大技术人员和搜索引擎优化人员密切关注的内容。 
  《这就是搜索引擎:核心技术详解》的特点是内容新颖全面而又通俗易懂。对于实际搜索引擎所涉及的各种核心技术都有全面细致的介绍,除了作为搜索系统核心的网络爬虫、索引系统、排序系统、链接分析及用户分析外,还包括网页反作弊、缓存管理、网页去重技术等实际搜索引擎必须关注的技术,同时用相当大的篇幅讲解了云计算与云存储的核心技术原理。另外,本书也密切关注搜索引擎发展的前沿技术:Google的咖啡因系统及Megastore等云计算新技术、百度的暗网抓取技术阿拉丁计划、内容农场作弊、机器学习排序等。诸多新技术在相关章节都有详细讲解,同时对于社会化搜索、实时搜索及情境搜索等搜索引擎的未来发展方向做了技术展望。为了增进读者的理解,全书大量引入形象的图片来讲解算法原理,相信读者会发现原来搜索引擎的核心技术理解起来比原先想象的要简单得多。

作者简介
张俊林,是技术书籍《这就是搜索引擎:核心技术详解》的作者,目前担任畅捷通智能平台总监。在此之前,张俊林曾经在*搜索技术中心、百度商务搜索部凤巢广告平台以及新浪微博搜索部及数据系统部担任资深技术专家,新浪微博技术委员会成员,负责算法策略方向。张俊林还曾是智能信息聚合网站“玩聚网”的联合创始人之一。他的研发兴趣集中在:搜索技术、推荐系统、社交挖掘、自然语言处理与大数据算法架构等方面,并在以上领域有多年工业界实践经验。张俊林本科毕业于天津大学管理学院,1999年至2004年在中科院软件所直接攻读博士学位,研究方向是信息检索理论与自然语言处理,就学期间曾在ACL/COLING/IJCNLP等国际*会议发表多篇学术论文,另外,他在此期间领导设计的搜索系统曾在美国国防部DARPA主持的TREC第二届高精度检索系统评测中在17只国际高水平研究团队激烈竞争中胜出并取得综合排名第一名的优异成绩。
目  录
第1章 搜索引擎及其技术架构 
 1.1 搜索引擎为何重要 
  1.1.1 互联网的发展 
  1.1.2 商业搜索引擎公司的发展 
  1.1.3 搜索引擎的重要地位 
 1.2 搜索引擎技术发展史 
  1.2.1 史前时代:分类目录的一代 
  1.2.2 第一代:文本检索的一代 
  1.2.3 第二代:链接分析的一代 
  1.2.4 第三代:用户中心的一代 
 1.3 搜索引擎的3个目标 
 1.4 搜索引擎的3个核心问题 
  1.4.1 3个核心问题 
  1.4.2 与技术发展的关系 
前  言
前言
互联网产品形形色色,有产品导向的,有营销导向的,也有技术导向的,但是以技术见长的互联网产品比例相对小些。搜索引擎是目前互联网产品中有技术含量的产品,如果不是唯一,至少也是其中之一。
经过十几年的发展,搜索引擎已经成为互联网的重要入口之一,Twitter联合创始人埃文威廉姆斯提出了“域名已死论”:好记的域名不再重要,因为人们会通过搜索进入网站。搜索引擎排名对于中小网站流量来说至关重要。了解搜索引擎简单界面背后的技术原理其实对很多人都很重要。
最初写本搜索引擎技术书籍的想法萌生于两年前,当时的场景是要给团队成员做搜索技术培训,但是我找遍了相关图书,却没有发现非常合适的搜索技术入门书籍。当时市面上的书籍,要么是信息检索理论方面的专著,理论性太强不易懂,而且真正讲搜索引擎技术的章节并不太多;要么是Lucene代码分析这种过于实务的书籍,像搜索引擎这种充满算法的应用,直接分析开源系统代码并不是非常高效的学习方式。所以当时萌生了写一本既通俗易懂,适合没有相关技术背景的人员阅读,又比较全面,且融入新技术的搜索引擎书籍,但是真正动手开始写是一年前的事情了。

 这就是搜索引擎:核心技术详解(搜索引擎相关技术 核心算法 云计算 云存储 搜索引擎优化)下载



发布书评

 
 

 

PDF图书网 

PDF图书网 @ 2017