扫一扫
关注中图网
官方微博
本类五星书更多>
-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
数据挖掘技术与应用教程 版权信息
- ISBN:9787030709929
- 条形码:9787030709929 ; 978-7-03-070992-9
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 所属分类:>
数据挖掘技术与应用教程 内容简介
本书总结编者多年教学经验,依据学生的学习特点,深入浅出地介绍数据挖掘过程中涉及的常见操作要点,包括数据挖掘相关概念、开发环境的使用、基础库、数据预处理、特征选择和降维、使用机器学习算法进行预测、模型评估等内容。各章在介绍基本原理之后,配有相关的操作实例,以巩固学习效果。 本书适合人工智能基础应用相关专业的教师和学生使用,也适合准备成为数据挖掘工程师的相关人员阅读。
数据挖掘技术与应用教程 目录
第1章 绪论
1.1 数据挖掘与大数据概述
1.2 我国大数据行业发展现状
1.3 数据挖掘预备知识
1.4 数据挖掘的基本流程
1.5 数据挖掘工作环境
第2章 科学计算库NumPy
2.1 ndarray 对象
2.1.1 ndarray的属性
2.1.2 ndarray的数据类型
2.1.3 ndarray 的创建
2.1.4 ndarray的操作
2.2 伪随机数生成
2.2.1 rand函数
2.2.2 randn函数
2.2.3 randint函数
2.2.4 uniform函数
2.2.5 normal函数
2.2.6 choice函数
2.3 索引和切片
2.3.1 索引
2.3.2 花式索引
2.3.3 切片
2.3.4 布尔型索引
2.4 NumPy运算
2.4.1 元素级运算
2.4.2 广播
2.4.3 通用函数
2.4.4 meshgrid函数
2.4.5 排序
2.4.6 统计函数
2.5 线性代数工具
2.5.1 diag函数
2.5.2 矩阵乘积
2.5.3 矩阵行列式
2.5.4 特征值和特征向量
2.5.5 求解线性方程组
2.6 数组的文件输入和输出
2.6.1 读写文本文件
2.6.2 读写二进制文件
第3章 绘图与可视化
3.1 可视化的基本概念
3.2 Matplotlib绘图
3.2.1 线型图
3.2.2 散点图
3.2.3 条形图
3.2.4 直方图
3.2.5 饼图
3.2.6 箱线图
3.2.7 等高线图
3.3 Seaborn绘图
3.3.1 分布图
3.3.2 关系图
3.3.3 分类图
3.3.4 回归图
3.3.5 热力图
3.3.6 分面网格图
第4章 数据分析库Pandas
4.1 数据类型
4.1.1 Series类型
4.1.2 DataFrame类型
4.2 统计函数
4.2.1 常用统计函数
4.2.2 面元划分
4.2.3 相关系数
4.3 缺失值处理
4.3.1 查看缺失数据
4.3.2 删除缺失数据
4.3.3 填充缺失数据
4.4 重复值处理
4.4.1 查询重复数据
4.4.2 删除重复数据
4.5 异常值处理
4.6 随机采样
4.7 数据转换
4.7.1 map
4.7.2 apply
4.7.3 applymap
4.7.4 replace
4.8 合并与拼接
4.8.1 merge
4.8.2 concat
4.8.3 combine_first
4.9 数据重塑
4.9.1 stack
4.9.2 unstack
4.10 数据分组与聚合
4.10.1 分组
4.10.2 聚合
4.11 透视表
4.12 数据加载与存储
4.12.1 文本文件的加载与存储
4.12.2 电子表格文件的加载与存储
第5章 数据预处理
5.1 数据清洗
5.1.1 缺失值处理
5.1.2 异常值处理
5.1.3 重复值处理
5.2 不均衡数据处理
5.2.1 过采样
5.2.2 欠采样
5.3 数据变换
5.3.1 特征缩放
5.3.2 特征编码
5.3.3 数值离散化
第6章 特征工程
6.1 特征选择
6.1.1 过滤法
6.1.2 包装法
6.1.3 嵌入法
6.2 特征降维
6.2.1 主成分分析
6.2.2 线性判别分析
第7章 数据建模
7.1 基础知识
7.1.1 数据集划分
7.1.2 抽样方法
7.1.3 偏差和方差
7.1.4 过拟合和欠拟合
7.1.5 算法分类
7.2 回归算法
7.2.1 线性回归
7.2.2 岭回归
7.2.3 套索回归
7.2.4 多项式回归
7.3 分类算法
7.3.1 决策树
7.3.2 随机森林
7.3.3 逻辑回归
7.3.4 k近邻
7.3.5 朴素贝叶斯
7.4 聚类算法
7.4.1 k均值
7.4.2 DBSCAN
第8章 参数优化与模型评估
8.1 参数优化
8.2 模型评估
8.2.1 回归模型评估
8.2.2 分类模型评估
8.2.3 聚类模型评估
参考文献
1.1 数据挖掘与大数据概述
1.2 我国大数据行业发展现状
1.3 数据挖掘预备知识
1.4 数据挖掘的基本流程
1.5 数据挖掘工作环境
第2章 科学计算库NumPy
2.1 ndarray 对象
2.1.1 ndarray的属性
2.1.2 ndarray的数据类型
2.1.3 ndarray 的创建
2.1.4 ndarray的操作
2.2 伪随机数生成
2.2.1 rand函数
2.2.2 randn函数
2.2.3 randint函数
2.2.4 uniform函数
2.2.5 normal函数
2.2.6 choice函数
2.3 索引和切片
2.3.1 索引
2.3.2 花式索引
2.3.3 切片
2.3.4 布尔型索引
2.4 NumPy运算
2.4.1 元素级运算
2.4.2 广播
2.4.3 通用函数
2.4.4 meshgrid函数
2.4.5 排序
2.4.6 统计函数
2.5 线性代数工具
2.5.1 diag函数
2.5.2 矩阵乘积
2.5.3 矩阵行列式
2.5.4 特征值和特征向量
2.5.5 求解线性方程组
2.6 数组的文件输入和输出
2.6.1 读写文本文件
2.6.2 读写二进制文件
第3章 绘图与可视化
3.1 可视化的基本概念
3.2 Matplotlib绘图
3.2.1 线型图
3.2.2 散点图
3.2.3 条形图
3.2.4 直方图
3.2.5 饼图
3.2.6 箱线图
3.2.7 等高线图
3.3 Seaborn绘图
3.3.1 分布图
3.3.2 关系图
3.3.3 分类图
3.3.4 回归图
3.3.5 热力图
3.3.6 分面网格图
第4章 数据分析库Pandas
4.1 数据类型
4.1.1 Series类型
4.1.2 DataFrame类型
4.2 统计函数
4.2.1 常用统计函数
4.2.2 面元划分
4.2.3 相关系数
4.3 缺失值处理
4.3.1 查看缺失数据
4.3.2 删除缺失数据
4.3.3 填充缺失数据
4.4 重复值处理
4.4.1 查询重复数据
4.4.2 删除重复数据
4.5 异常值处理
4.6 随机采样
4.7 数据转换
4.7.1 map
4.7.2 apply
4.7.3 applymap
4.7.4 replace
4.8 合并与拼接
4.8.1 merge
4.8.2 concat
4.8.3 combine_first
4.9 数据重塑
4.9.1 stack
4.9.2 unstack
4.10 数据分组与聚合
4.10.1 分组
4.10.2 聚合
4.11 透视表
4.12 数据加载与存储
4.12.1 文本文件的加载与存储
4.12.2 电子表格文件的加载与存储
第5章 数据预处理
5.1 数据清洗
5.1.1 缺失值处理
5.1.2 异常值处理
5.1.3 重复值处理
5.2 不均衡数据处理
5.2.1 过采样
5.2.2 欠采样
5.3 数据变换
5.3.1 特征缩放
5.3.2 特征编码
5.3.3 数值离散化
第6章 特征工程
6.1 特征选择
6.1.1 过滤法
6.1.2 包装法
6.1.3 嵌入法
6.2 特征降维
6.2.1 主成分分析
6.2.2 线性判别分析
第7章 数据建模
7.1 基础知识
7.1.1 数据集划分
7.1.2 抽样方法
7.1.3 偏差和方差
7.1.4 过拟合和欠拟合
7.1.5 算法分类
7.2 回归算法
7.2.1 线性回归
7.2.2 岭回归
7.2.3 套索回归
7.2.4 多项式回归
7.3 分类算法
7.3.1 决策树
7.3.2 随机森林
7.3.3 逻辑回归
7.3.4 k近邻
7.3.5 朴素贝叶斯
7.4 聚类算法
7.4.1 k均值
7.4.2 DBSCAN
第8章 参数优化与模型评估
8.1 参数优化
8.2 模型评估
8.2.1 回归模型评估
8.2.2 分类模型评估
8.2.3 聚类模型评估
参考文献
展开全部
书友推荐
本类畅销
-
Photoshop 2022中文版案例教程
¥44.1¥59.8 -
局域网组建、管理与维护(第4版)(微课版)
¥47¥59 -
园林AUTOCAD教程
¥24¥45 -
Python实战编程:从零学Python
¥81¥108 -
Java程序设计基础
¥37¥50 -
数据备份与恢复
¥51.4¥69