-
>
中医基础理论
-
>
高校军事课教程
-
>
思想道德与法治(2021年版)
-
>
毛泽东思想和中国特色社会主义理论体系概论(2021年版)
-
>
中医内科学·全国中医药行业高等教育“十四五”规划教材
-
>
中医诊断学--新世纪第五版
-
>
中药学·全国中医药行业高等教育“十四五”规划教材
21世纪高等学校计算机专业核心课程规划教材数据挖掘原理与算法(第3版)/毛国君 版权信息
- ISBN:9787302415817
- 条形码:9787302415817 ; 978-7-302-41581-7
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>>
21世纪高等学校计算机专业核心课程规划教材数据挖掘原理与算法(第3版)/毛国君 本书特色
《数据挖掘原理与算法(第3版)》在经典教材的基础上,重点增加了大数据挖掘等新的数据挖掘的需求和技术分析,对Web挖掘的内容进行了重新编排,并增加了必要的新方法。近年来出现的公认的典型算法和技术也得到加强,使之很好地适应读者在教学或者学习中的新需求。 本书内容相对全面,各章之间耦合度小。作为教材,教师可以根据学生类型、学时安排等进行选择性教学。作为参考书,读者可以根据自己的基础进行选择性学习或查阅。在每章后面都设置专门一节来对本章内容和文献引用情况进行归纳,它不仅可以帮助读者对相关内容进行整理,而且对读者,特别是研究人员,也起到文献的注释性索引功能。
21世纪高等学校计算机专业核心课程规划教材数据挖掘原理与算法(第3版)/毛国君 内容简介
本书是一本全面介绍数据挖掘和知识发现技术的专业书籍,系统地阐述了数据挖掘和知识发现技术的产生、发展、应用以及相关概念、原理和算法,对数据挖掘中的主要技术分支,包括关联规则、分类、聚类、序列、空间以及Web挖掘等进行了理论剖析和算法描述。本书的许多内容是作者们在攻读博士学位期间的工作总结,一方面,对于相关概念和技术的阐述尽量先从理论分析入手,在此基础上进行技术归纳; 另一方面,为了保证技术的系统性,所有的挖掘模型和算法描述都在统一的技术归纳框架下进行。同时,为了避免抽象算法描述给读者带来的理解困难,本书的所有典型算法都通过具体跟踪执行实例来进一步说明。 全书共分8章,各章相对独立成篇,以利于读者选择性学习。在每章后面都设置专门一节来对本章内容和文献引用情况进行归纳,它不仅可以帮助读者对相关内容进行整理,而且也起到对本章内容相关文献的注释性索引功能。 本书可作为计算机专业研究生或高年级本科生教材,也可以作为从事计算机研究和开发人员的参考资料。作为教材,教师可以根据课时安排进行选择性教学。为了更好地让教师进行选择性教学,本书配有专门的教师用书,对内容的重点、难点和课时分配给出了对应的建议,对重要的和难度较大的习题进行了分析和解答。对于研究人员,本书是一本高参考价值的专业书籍。对于软件技术人员,可以把它当作提高用书或参考资料,一些算法可以通过改造用于实际的应用系统中。
21世纪高等学校计算机专业核心课程规划教材数据挖掘原理与算法(第3版)/毛国君 目录
1.1 数据挖掘技术的产生与发展
1.1.1 数据挖掘技术的商业需求分析
1.1.2 数据挖掘产生的技术背景分析
1.1.3 大数据时代的数据挖掘技术需求分析
1.2 数据挖掘研究的发展趋势
1.3 数据挖掘概念
1.3.1 从商业角度看数据挖掘技术
1.3.2 数据挖掘的技术含义
1.3.3 数据挖掘研究的理论基础
1.4 数据挖掘技术的分类问题
1.5 数据挖掘常用的知识表示模式与方法
1.5.1 广义知识挖掘
1.5.2 关联知识挖掘
1.5.3 类知识挖掘
1.5.4 预测型知识挖掘
1.5.5 特异型知识挖掘
1.6 不同数据存储形式下的数据挖掘问题
1.6.1 事务数据库中的数据挖掘
1.6.2 关系型数据库中的数据挖掘
1.6.3 数据仓库中的数据挖掘
1.6.4 在关系模型基础上发展的新型数据库中的数据挖掘
1.6.5 面向应用的新型数据源中的数据挖掘
1.6.6 Web数据源中的数据挖掘
1.7 粗糙集方法及其在数据挖掘中的应用
1.7.1 粗糙集的一些重要概念
1.7.2 粗糙集应用举例
1.7.3 粗糙集方法在KDD中的应用范围
1.8 数据挖掘的应用分析
1.8.1 数据挖掘与CRM
1.8.2 数据挖掘与社会网络
1.8.3 数据挖掘应用的成功案例分析
1.9 本章小结和文献注释
习题1
第2章 知识发现过程与应用结构
2.1 知识发现的基本过程
2.1.1 数据抽取与集成技术要点
2.1.2 数据清洗与预处理技术要点
2.1.3 数据的选择与整理技术要点
2.1.4 数据挖掘技术要点
2.1.5 模式评估技术要点
2.2 数据库中的知识发现处理过程模型
2.2.1 阶梯处理过程模型
2.2.2 螺旋处理过程模型
2.2.3 以用户为中心的处理模型
2.2.4 联机KDD模型
2.2.5 支持多数据源多知识模式的KDD处理模型
2.3 知识发现软件或工具的发展
2.3.1 独立的知识发现软件
2.3.2 横向的知识发现工具集
2.3.3 纵向的知识发现解决方案
2.3.4 KDD系统介绍
2.4 知识发现项目的过程化管理
2.5 数据挖掘语言介绍
2.5.1 数据挖掘语言的分类
2.5.2 数据挖掘查询语言
2.5.3 数据挖掘建模语言
2.5.4 通用数据挖掘语言
2.5.5 DMQL挖掘查询语言介绍
2.6 本章小结和文献注释
习题2
第3章 关联规则挖掘理论和算法
3.1 基本概念与解决方法
3.2 经典的频繁项目集生成算法分析
3.2.1 项目集空间理论
3.2.2 经典的发现频繁项目集算法
3.2.3 关联规则生成算法
3.3 Apriori算法的性能瓶颈问题
3.4 Apriori的改进算法
3.4.1 基于数据分割的方法
3.4.2 基于散列的方法
3.4.3 基于采样的方法
3.5 项目集空间理论的发展
3.5.1 Close算法
3.5.2 FP-tree算法
3.6 项目集格空间和它的操作
3.7 基于项目集操作的关联规则挖掘算法
3.7.1 关联规则挖掘空间
3.7.2 三个实用算子
3.7.3 *大频繁项目集格的生成算法
3.7.4 ISS-DM算法执行示例
3.8 改善关联规则挖掘质量问题
3.8.1 用户主观层面
3.8.2 系统客观层面
3.9 约束数据挖掘问题
3.9.1 约束在数据挖掘中的作用
3.9.2 约束的类型
3.10 时态约束关联规则挖掘
3.11 关联规则挖掘中的一些更深入的问题
3.11.1 多层次关联规则挖掘
3.11.2 多维关联规则挖掘
3.11.3 数量关联规则挖掘
3.12 数量关联规则挖掘方法
3.12.1 数量关联规则挖掘问题
3.12.2 数量关联规则的分类
3.12.3 数量关联规则挖掘的一般步骤
3.12.4 数值属性离散化问题及算法
3.13 本章小结和文献注释
习题3
第4章 分类方法
4.1 分类的基本概念与步骤
4.2 基于距离的分类算法
4.3 决策树分类方法
4.3.1 决策树基本算法概述
4.3.2 ID3算法
4.3.3 C4.5 算法
4.4 贝叶斯分类
4.4.1 贝叶斯定理
4.4.2 朴素贝叶斯分类
4.4.3 EM算法
4.5 规则归纳
4.5.1 AQ算法
4.5.2 CN2算法
4.5.3 FOIL算法
4.6 与分类有关的其他问题
4.6.1 分类数据预处理
4.6.2 分类器性能的表示与评估
4.7 本章小结和文献注释
习题4
……
第5章 聚类方法
第6章 时间序列和序列模式挖掘
第7章 Web挖掘技术
第8章 空间挖掘
参考文献
21世纪高等学校计算机专业核心课程规划教材数据挖掘原理与算法(第3版)/毛国君 节选
《数据挖掘原理与算法(第3版)》: 2.1.1 数据抽取与集成技术要点 在弄清源数据的信息和结构的基础上,首先需要准确地界定所选取的数据源和抽取原则。将多数据库运行环境中的数据进行合并处理达到数据集成的目的。然后设计存储新数据的结构和准确定义它与源数据的转换和装载机制,以便正确地从每个数据源中抽取所需的数据。这些结构和转换信息应该作为元数据(Metadata)被存储起来。在数据抽取过程中,必须要全面掌握源数据的结构特点,任何疏忽都可能导致数据抽取的失败。在抽取多个异构数据源的过程中,可能需要将不同的源数据格式转换成一种中间模式,再把它们集成起来。数据抽取与集成是知识发现的关键性工作。早期的数据抽取是依靠手工编程来实现的,现在可以通过高效的抽取工具来实现。即使是使用抽取工具,数据抽取和装载仍然是一件很艰苦的工作。应用领域的分析数据通常来自多个数据源,所以必须进行数据集成。来自不同源的数据可能有模式定义上的差异,也可能存在因数据冗余而无法确定有效数据的情形。此外,还要考虑数据库系统本身可能存在不兼容的情况。 2.1.2 数据清洗与预处理技术要点 如前所述,在开始一个知识发现项目之前必须清晰地定义挖掘目标。虽然挖掘的*后结果是不可预测的,但是要解决或探索的问题应该是可预见的。盲目性地挖掘是没有任何意义的。在弄清业务问题后就可以进行数据的准备。数据预处理是进行数据分析和挖掘的基础,如果所集成的数据不正确,数据挖掘算法输出的结果也必然不正确,这样形成的决策支持是不可靠的。因此,要提高挖掘结果的准确率,数据预处理是不可忽视的一步。对数据进行预处理,一般需要对源数据进行再加工,检查数据的完整性及数据的一致性,对其中的噪声数据进行平滑,对丢失的数据进行填补,清除“脏”数据,清除重复记录等。常见的数据预处理方法有:数据清洗、数据变换和数据归约等。 数据清洗是指去除或修补源数据中的不完整、不一致、含噪声的数据。在源数据中,可能由于疏忽、懒惰甚至为了保密使系统设计人员无法得到某些数据项的数据。假如这个数据项正是知识发现系统所关心的,那么这类不完整的数据就需要修补。 常见的不完整数据的修补办法有: 使用一个全局值来填充(如unknown、估计的*大数或*小数)。 统计该属性的所有非空值,并用平均值来填充空缺项。 只使用同类对象的属性平均值填充。 利用回归或工具预测*可能的值,并用它来填充。 数据不一致可能是由于源数据库中对相同属性数据所使用的数据类型、度量单位等不同而导致的。因此需要定义它们的转换规则,并在挖掘前统一成一个形式。噪声数据是指那些明显不符合逻辑的偏差数据(如某雇员200岁),这样的数据往往影响挖掘结果的正确性。 目前讨论*多的处理噪声数据的方法是数据平滑(DataSmoothing)技术。1999年,Pyle系统地归纳了利用数据平滑技术消除噪声数据的方法。主要有: 利用分箱(Binning)方法检测周围相应属性的值来进行局部数据平滑。 利用聚类技术检测孤立点数据,对它们进行修正。 利用回归函数探测和修正噪声数据。 2.1.3 数据的选择与整理技术要点 没有高质量的数据就不可能有高质量的挖掘结果。为了得到一个高质量的适合挖掘的数据子集,一方面需要通过数据清洗来消除干扰性数据,另一方面也需要针对挖掘目标进行数据选择。数据选择的目的是辨别出需要分析的数据集合,缩小处理范围,提高数据挖掘的质量。数据选择可以使后面的数据挖掘工作聚焦到和挖掘任务相关的数据子集中。不仅提高了挖掘效率,而且也保证了挖掘的准确性。我们认为,数据选择可以通过对目标数据加以正面限制或条件约束,挑选那些符合条件的数据。也可以通过对不感兴趣的数据加以排除,只保留那些可能感兴趣的数据。必须深入分析应用目标对数据的要求,确定合适的数据选择或数据过滤策略,才能保证目标数据的质量。被挑选的数据必须整理成合适的存储形式才能被挖掘算法所使用。 利用数据变换或归约等技术可以将数据整理成适合进一步挖掘的数据格式。数据变换可以根据需要构造出新的属性以帮助理解分析数据的特点,或者将数据规范化,使之落在一个特定的数据区间中。数据归约则是在尽可能保证数据完整性的基础上,将数据以其他方式进行表示,以减少数据存储空间,使挖掘过程更有效。常用的归约策略有:数据立方体聚集、维归约、数据压缩、数值压缩和离散化等。 ……
- >
月亮与六便士
月亮与六便士
¥18.1¥42.0 - >
月亮虎
月亮虎
¥14.4¥48.0 - >
上帝之肋:男人的真实旅程
上帝之肋:男人的真实旅程
¥19.3¥35.0 - >
随园食单
随园食单
¥15.4¥48.0 - >
伯纳黛特,你要去哪(2021新版)
伯纳黛特,你要去哪(2021新版)
¥16.9¥49.8 - >
小考拉的故事-套装共3册
小考拉的故事-套装共3册
¥36.7¥68.0 - >
罗庸西南联大授课录
罗庸西南联大授课录
¥16.6¥32.0 - >
苦雨斋序跋文-周作人自编集
苦雨斋序跋文-周作人自编集
¥6.9¥16.0
-
食品添加剂
¥33.5¥45 -
VB语言程序设计
¥29.9¥39.8 -
C语言程序设计习题与实验指导
¥9.1¥18 -
地下建筑结构-(第三版)-(赠课件)
¥49.4¥55 -
模具制图
¥37.8¥49 -
工程机械结构认知
¥10.5¥22