-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
大数据搜索引擎——原理分析及编程实现 版权信息
- ISBN:9787121291647
- 条形码:9787121291647 ; 978-7-121-29164-7
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 所属分类:>
大数据搜索引擎——原理分析及编程实现 内容简介
本书向读者提供了一套完整的大数据时代背景下的搜索引擎解决方案,详尽地介绍了搜索引擎的技术架构、算法体系及取得的效果,以模块化的方式进行组织。着重介绍了机器学习在搜索引擎中的应用,包括中文分词、聚类、分类等核心的机器学习算法,并结合示例加以介绍和分析,使读者可以更好地理解机器学习在搜索引擎中的价值。还阐述了大数据给搜索引擎带来的新特性,结合目前大数据分析的主流工具,在搜索引擎中构建知识图谱,以及进行日志反馈学习机制,使得搜索引擎更加智能。 本书适合作为互联网行业从业者的技术参考书,也适合作为搜索引擎爱好者的参考读物。
大数据搜索引擎——原理分析及编程实现 目录
1.1 搜索引擎的过去
1.2 搜索引擎的现在
1.3 搜索引擎的未来
1.4 大数据与搜索引擎
1.4.1 搜索价值提升
1.4.2 用户价值提升
1.5 大数据与人工智能
1.5.1 人工智能发展
1.5.2 人工智能技术
1.6 本章小结
第2章 搜索引擎原理与技术
2.1 基本工作原理
2.2 基本模块结构
2.2.1 爬虫服务
2.2.2 索引服务
2.2.3 缓存服务
2.2.4 搜索服务
2.2.5 日志服务
2.3 技术概要
2.3.1 自然语言处理
2.3.2 知识图谱技术
2.3.3 海量数据存储
2.3.4 分布式计算
2.3.5 搜索排序技术
2.4 本章小结
第3章 自然语言处理框架
3.1 英文分词
3.2 中文分词
3.2.1 中文分词概述
3.2.2 基于词库的分词技术
3.2.3 基于条件随机场的中文分词
3.2.4 分词粒度
3.3 词性标注
3.3.1 隐马尔科夫模型概要
3.3.2 隐马尔科夫模型与词性标注
3.4 语义相似度
3.5 依存句法分析
3.5.1 依存句法分析概要
3.5.2 依存句法分析实现
……
第4章 构建大数据存储引擎
第5章 构建分布式实时计算
第6章 分布式可扩展爬虫
第7章 大数据构建知识图谱
第8章 索引构建机制
第9章 搜索服务构建
第10章 基于用户日志的反馈学习
大数据搜索引擎——原理分析及编程实现 作者简介
刘凡平:硕士,毕业于中国科学技术大学软件系统设计专业。曾任职于微软亚太研发集团、百度(中国)有限公司。现任薇问(北京)科技有限公司首席技术官,负责搜索引擎技术与大数据人工智能平台研发工作。擅长于搜索引擎、大数据分析、分布式计算等相关研发工作,是Iveelv开源搜索引擎的主要贡献者之一,也是执着于将互联网技术演绎为艺术的完美追求者。
- >
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
¥9.9¥23.0 - >
经典常谈
经典常谈
¥16.3¥39.8 - >
唐代进士录
唐代进士录
¥15.1¥39.8 - >
随园食单
随园食单
¥21.6¥48.0 - >
我与地坛
我与地坛
¥15.4¥28.0 - >
月亮与六便士
月亮与六便士
¥18.1¥42.0 - >
人文阅读与收藏·良友文学丛书:一天的工作
人文阅读与收藏·良友文学丛书:一天的工作
¥14.7¥45.8 - >
自卑与超越
自卑与超越
¥13.5¥39.8
-
基于近邻思想和同步模型的聚类算法
¥44.1¥59 -
深度学习
¥92.4¥168 -
微信背后的产品观
¥62.6¥88 -
NGINX经典教程
¥89.9¥119.8 -
图解TCP/IP(第6版)
¥56.9¥79.8 -
物联网动态服务的协同感知与调控优化
¥51.4¥72