-
>
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用
-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
JAVA持续交付
-
>
EXCEL最强教科书(完全版)(全彩印刷)
-
>
深度学习
文本挖掘与信息检索概论 版权信息
- ISBN:9787302597445
- 条形码:9787302597445 ; 978-7-302-59744-5
- 装帧:70g胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
文本挖掘与信息检索概论 本书特色
可作为人工智能、数据科学、计算机、软件工程等专业的高年级本科生和研究生教材,也对从事相关工作的科研人员具有一定参考价值。
文本挖掘与信息检索概论 内容简介
文本挖掘与信息检索是近年来人工智能领域的热点研究方向。本书共8章,包括信息检索概述、信息检索模型、信息检索的评价、文本分类技术、文本聚类技术、自动摘要技术、文本推荐技术和网页链接分析,融合了统计学、机器学习、数据库等知识,具有多学科交叉的特点。 内容全面,案例丰富,适合作为人工智能、数据科学、计算机、软件工程等专业的本科生和研究生教材,也可作为企事业单位相关研究人员的参考资料。
文本挖掘与信息检索概论 目录
目录
第1章信息检索概述
1.1数据、信息和知识
1.1.1从数据到信息
1.1.2从信息到知识
1.2信息检索的定义
1.3信息检索的发展
1.3.1信息检索的发展历史
1.3.2信息检索的主要方法
1.3.3信息检索的应用
1.3.4信息检索的发展趋势
习题
第2章信息检索模型
2.1概述
2.2向量空间检索模型
2.2.1内积
2.2.2相似度计算
2.3概率检索模型
2.3.1概率论基础知识
2.3.2词项权重
2.3.3二值独立模型
2.3.4非二值独立模型
2.4基于语言建模的信息检索模型
2.4.1庞特模型
2.4.2零概率问题以及解决方法
2.4.3语言模型检索框架
2.4.4跨语言检索模型
习题
第3章信息检索的评价
3.1信息检索的评价指标
3.1.1查全率
3.1.2査准率
3.1.3查准率与查全率的关系
3.1.4漏检率和误检率
3.1.5响应时间
3.2信息检索系统的评价
习题
第4章文本分类技术
4.1概述
4.1.1基本概念
4.1.2文本自动分类的两种类型
4.1.3文本分类模式
4.1.4文本分类过程
4.2文本预处理
4.2.1分词技术
4.2.2停用词去除
4.2.3文本特征选择方法
4.2.4文本表示方法
4.3相似度度量方法
4.4常用分类算法分析
4.4.1Rocchio算法
4.4.2贝叶斯分类器
4.4.3贝叶斯信念网络
4.4.4K近邻算法
4.4.5支持向量机
4.5分类性能评价
4.5.1精确度和召回率
4.5.2F测量
4.5.3分类方法的综合评价
4.6基于向量空间模型的文本分类方法
4.6.1文本分类系统的结构框架
4.6.2改进的文本特征抽取算法
4.6.3二级分类模式
4.7基于语言模型的文本分类
4.7.1概述
4.7.2Bigram模型
4.7.3特征提取
4.7.4分类器设计
4.7.5统计平滑
4.8基于卷积神经网络的文本分类
4.8.1CNN概述
4.8.2CNN文本分类经典结构
4.8.3CNN文本分类方法
习题
第5章文本聚类技术
5.1概述
5.2常用的聚类方法
5.2.1基于划分的聚类方法
5.2.2基于分层的聚类方法
5.2.3基于密度的聚类方法
5.2.4基于网格的聚类方法
5.2.5基于模型的聚类方法
5.3聚类算法的评价标准
5.4基于Kmeans的文本聚类算法
5.4.1概述
5.4.2Kmeans算法理论基础
5.4.3Kmeans算法结果影响因素
5.4.4TFIDF理论基础
5.4.5基于Kmeans文本聚类的主要步骤
5.4.6基于Kmeans算法的聚类实例
5.5基于潜在语义索引的文本聚类方法
5.5.1概述
5.5.2矩阵的奇异值分解
5.5.3LSI技术的理论基础
5.5.4基于LSI文本聚类的主要步骤
5.5.5基于LSI文本聚类的实例
5.6基于Word2Vec的文本聚类方法
5.6.1词向量概述
5.6.2Word2Vec语言模型
5.6.3连续词袋模型
5.6.4Skipgram模型
5.6.5基于Word2Vec的文本聚类举例
习题
第6章自动摘要技术
6.1概述
6.2抽取式摘要
6.2.1基于TextRank的文本自动摘要
6.2.2基于图模型的文本自动摘要
6.2.3融合噪声检测的多文档自动摘要
6.2.4抽取式多文档自动摘要
6.3生成式摘要
6.3.1融合词汇特征的生成式摘要模型
6.3.2基于深度学习的文本自动摘要
6.3.3基于HITS注意力神经网络的生成式摘要模型
6.4自动摘要的评价方法
6.4.1内部评价法
6.4.2外部评价法
习题
第7章文本推荐技术
7.1基于内容的推荐方法
7.1.1概述
7.1.2存在的问题
7.2基于协同过滤的推荐方法
7.2.1基于用户的协同过滤推荐方法
7.2.2基于物品的协同过滤推荐方法
7.2.3存在的问题
7.3混合推荐方法
7.4基于图表示学习的推荐方法
7.4.1图表示学习方法
7.4.2基于图表示学习的推荐
7.4.3基于DeepWalk异构文献网络表示学习的个性化全局
引文推荐方法
7.5推荐系统的评价
7.5.1评价指标
7.5.2基于DeepWalk异构文献网络表示学习的个性化全局引文推荐方法
的实验结果分析
习题
第8章网页链接分析
8.1超链和页面内容的关系
8.2特征提取和特征表示
8.3不同搜索阶段的分析
8.4PageRank算法
8.4.1PageRank算法定义
8.4.2PageRank算法的优点和缺点
8.4.3基于LexRank的多文档自动摘要方法
8.5HITS算法
8.5.1HITS算法定义
8.5.2寻找其他的特征向量
8.5.3寻找同引分析和文献耦合的关系
8.5.4HITS算法的优点和缺点
8.5.5基于HITS的多文档自动摘要
8.6两种算法的比较
8.7链接分析的应用
习题
参考文献
- >
伯纳黛特,你要去哪(2021新版)
伯纳黛特,你要去哪(2021新版)
¥16.9¥49.8 - >
伊索寓言-世界文学名著典藏-全译本
伊索寓言-世界文学名著典藏-全译本
¥6.7¥19.0 - >
名家带你读鲁迅:故事新编
名家带你读鲁迅:故事新编
¥13.0¥26.0 - >
唐代进士录
唐代进士录
¥16.1¥39.8 - >
【精装绘本】画给孩子的中国神话
【精装绘本】画给孩子的中国神话
¥18.6¥55.0 - >
经典常谈
经典常谈
¥16.7¥39.8 - >
我与地坛
我与地坛
¥16.4¥28.0 - >
李白与唐代文化
李白与唐代文化
¥9.9¥29.8
-
大模型应用开发极简入门 基于GPT-4和ChatGPT
¥41.9¥59.8 -
人工智能 现代方法 第4版(全2册)
¥120.8¥198 -
计算机视觉:算法与应用
¥95.9¥139 -
必然(修订版)
¥53.5¥89 -
GPT时代人类再腾飞
¥54.9¥89.9 -
生成式人工智能(AIGC)应用
¥64.9¥90
暂AH课标数学4下(人教版)/拔尖特训
¥21.9¥39.8中部老工业城市承接产业转移影响因素与效应研究
¥38.4¥68.0中国住宅商品房价格区域异质性研究 基于货币政策及交易行为的视角
¥51.2¥88.0电力设备试验常见问题解析
¥30.4¥60.0真实感三维场景建模与绘制
¥31.0¥79.0