-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
文本挖掘中若干关键问题研究 版权信息
- ISBN:9787312022807
- 条形码:9787312022807 ; 978-7-312-02280-7
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 所属分类:>
文本挖掘中若干关键问题研究 本书特色
自动文本分类是将自然文本文件根据内容自动分为预先定义的一个或几个类别的过程,基于统计学习、机器学习的文本分类技术已经成为主流技术,本书对基于统计学习的文本分类及其相关技术进行了研究,为解决文本分类的稀疏性和高维性问题,基于偏*小二乘理论,提出一种新的维数约简算法,从提高文本分类性能和准确性出发,运用偏*小二乘的*新理论成果,提出了一种能较好提取潜在语义的新文本分类模型,对于数量庞大的文档类别,传统的平坦文本分类的性能受到很大的制约,层次文本分类是一种有效的解决方法,由此提出了一种新的层次文本分类模型。
文本挖掘中若干关键问题研究 内容简介
本书介绍了文本分类和偏*小二乘回归,提出了基于变量投影重要性指标的文本分类特征选择方法,论述了偏*小二乘logistic文本分类模型,阐述了chtc层次文本分类模型的研究工作,本书可供相关领域科研工作者、大学高年级学生和研究生阅读。
文本挖掘中若干关键问题研究 目录
第1章 导论
1.1 研究背景
1.2 文本分类综述
1.3 本书的内容结构
1.4 本书的创新工作
第2章 文本分类概述
2.1 文本分类的数学定义
2.2 文本分类任务的特点
2.3 文本分类系统的组成
2.4 文档预处理
2.5 文档的表示
2.6 常用文本分类模型
2.7 文本分类器学习、测试和评价
第3章 偏*小二乘回归方法的基本理论
3.1 偏*小二乘回归的发展历史
3.2 偏*小二乘回归的基本原理
3.3 偏*小二乘回归的基本思想
3.4 数学原理
3.5 偏*小二乘回归的理论算法
3.6 成分数的确定
第4章 基于变量投影重要性指标的特征选择方法研究
4.1 维数约简技术
4.2 符号约定
4.3 常用的特征选择方法
4.4 常用的特征抽取方法
4.5 基于变量投影重要性指标的特征选择方法
4.6 实验结果和分析
第5章 偏*小二乘logistic文本分类模型研究
5.1 logistic回归模型
5.2 偏*小二乘logistic回归模型
5.3 偏*小二乘logistic文本分类模型
5.4 实验结果和分析
第6章 ghtc层次文本分类模型研究
6.1 层次分类概述
6.2 层次特征选择
6.3 ghtc层次文本分类模型
6.4 实验结果和分析
第7章 总结与展望
7.1 总结
7.2 研究展望
附录1 reuters-21578前10个常见类和前10个稀有类的前20个特征vip值
附录2 复旦文本分类语料库部分类别的前20个特征vip值
附录3 ohsumed语料库层次结构
附录4 20 newsgroups语料库各节点各特征维数的微平均f1值和宏平均f1值变化情况
参考文献
后记
文本挖掘中若干关键问题研究 节选
《文本挖掘中若干关键问题研究》介绍了文本分类和偏*小二乘回归,提出了基于变量投影重要性指标的文本分类特征选择方法,论述了偏*小二乘Logistic文本分类模型,阐述了CHTC层次文本分类模型的研究工作,《文本挖掘中若干关键问题研究》可供相关领域科研工作者、大学高年级学生和研究生阅读。
- >
大红狗在马戏团-大红狗克里弗-助人
大红狗在马戏团-大红狗克里弗-助人
¥6.2¥10.0 - >
李白与唐代文化
李白与唐代文化
¥9.5¥29.8 - >
回忆爱玛侬
回忆爱玛侬
¥10.5¥32.8 - >
随园食单
随园食单
¥15.4¥48.0 - >
我从未如此眷恋人间
我从未如此眷恋人间
¥16.4¥49.8 - >
【精装绘本】画给孩子的中国神话
【精装绘本】画给孩子的中国神话
¥17.6¥55.0 - >
诗经-先民的歌唱
诗经-先民的歌唱
¥15.1¥39.8 - >
上帝之肋:男人的真实旅程
上帝之肋:男人的真实旅程
¥19.3¥35.0
-
”互联网+“时代计算机算法的应用及其实践研究
¥19.9¥59 -
微服务设计
¥52.8¥69 -
图说深度学习:用可视化方法理解复杂概念
¥109¥188 -
计算机基础
¥17.2¥31 -
改变未来的九大算法
¥50¥68 -
生成式AI入门与AWS实战
¥77.8¥99.8