扫一扫
关注中图网
官方微博
本类五星书更多>
-
>
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用
-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
JAVA持续交付
-
>
EXCEL最强教科书(完全版)(全彩印刷)
-
>
深度学习
数据挖掘技术与应用教程 版权信息
- ISBN:9787030709929
- 条形码:9787030709929 ; 978-7-03-070992-9
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 所属分类:>
数据挖掘技术与应用教程 内容简介
本书总结编者多年教学经验,依据学生的学习特点,深入浅出地介绍数据挖掘过程中涉及的常见操作要点,包括数据挖掘相关概念、开发环境的使用、基础库、数据预处理、特征选择和降维、使用机器学习算法进行预测、模型评估等内容。各章在介绍基本原理之后,配有相关的操作实例,以巩固学习效果。 本书适合人工智能基础应用相关专业的教师和学生使用,也适合准备成为数据挖掘工程师的相关人员阅读。
数据挖掘技术与应用教程 目录
第1章 绪论
1.1 数据挖掘与大数据概述
1.2 我国大数据行业发展现状
1.3 数据挖掘预备知识
1.4 数据挖掘的基本流程
1.5 数据挖掘工作环境
第2章 科学计算库NumPy
2.1 ndarray 对象
2.1.1 ndarray的属性
2.1.2 ndarray的数据类型
2.1.3 ndarray 的创建
2.1.4 ndarray的操作
2.2 伪随机数生成
2.2.1 rand函数
2.2.2 randn函数
2.2.3 randint函数
2.2.4 uniform函数
2.2.5 normal函数
2.2.6 choice函数
2.3 索引和切片
2.3.1 索引
2.3.2 花式索引
2.3.3 切片
2.3.4 布尔型索引
2.4 NumPy运算
2.4.1 元素级运算
2.4.2 广播
2.4.3 通用函数
2.4.4 meshgrid函数
2.4.5 排序
2.4.6 统计函数
2.5 线性代数工具
2.5.1 diag函数
2.5.2 矩阵乘积
2.5.3 矩阵行列式
2.5.4 特征值和特征向量
2.5.5 求解线性方程组
2.6 数组的文件输入和输出
2.6.1 读写文本文件
2.6.2 读写二进制文件
第3章 绘图与可视化
3.1 可视化的基本概念
3.2 Matplotlib绘图
3.2.1 线型图
3.2.2 散点图
3.2.3 条形图
3.2.4 直方图
3.2.5 饼图
3.2.6 箱线图
3.2.7 等高线图
3.3 Seaborn绘图
3.3.1 分布图
3.3.2 关系图
3.3.3 分类图
3.3.4 回归图
3.3.5 热力图
3.3.6 分面网格图
第4章 数据分析库Pandas
4.1 数据类型
4.1.1 Series类型
4.1.2 DataFrame类型
4.2 统计函数
4.2.1 常用统计函数
4.2.2 面元划分
4.2.3 相关系数
4.3 缺失值处理
4.3.1 查看缺失数据
4.3.2 删除缺失数据
4.3.3 填充缺失数据
4.4 重复值处理
4.4.1 查询重复数据
4.4.2 删除重复数据
4.5 异常值处理
4.6 随机采样
4.7 数据转换
4.7.1 map
4.7.2 apply
4.7.3 applymap
4.7.4 replace
4.8 合并与拼接
4.8.1 merge
4.8.2 concat
4.8.3 combine_first
4.9 数据重塑
4.9.1 stack
4.9.2 unstack
4.10 数据分组与聚合
4.10.1 分组
4.10.2 聚合
4.11 透视表
4.12 数据加载与存储
4.12.1 文本文件的加载与存储
4.12.2 电子表格文件的加载与存储
第5章 数据预处理
5.1 数据清洗
5.1.1 缺失值处理
5.1.2 异常值处理
5.1.3 重复值处理
5.2 不均衡数据处理
5.2.1 过采样
5.2.2 欠采样
5.3 数据变换
5.3.1 特征缩放
5.3.2 特征编码
5.3.3 数值离散化
第6章 特征工程
6.1 特征选择
6.1.1 过滤法
6.1.2 包装法
6.1.3 嵌入法
6.2 特征降维
6.2.1 主成分分析
6.2.2 线性判别分析
第7章 数据建模
7.1 基础知识
7.1.1 数据集划分
7.1.2 抽样方法
7.1.3 偏差和方差
7.1.4 过拟合和欠拟合
7.1.5 算法分类
7.2 回归算法
7.2.1 线性回归
7.2.2 岭回归
7.2.3 套索回归
7.2.4 多项式回归
7.3 分类算法
7.3.1 决策树
7.3.2 随机森林
7.3.3 逻辑回归
7.3.4 k近邻
7.3.5 朴素贝叶斯
7.4 聚类算法
7.4.1 k均值
7.4.2 DBSCAN
第8章 参数优化与模型评估
8.1 参数优化
8.2 模型评估
8.2.1 回归模型评估
8.2.2 分类模型评估
8.2.3 聚类模型评估
参考文献
1.1 数据挖掘与大数据概述
1.2 我国大数据行业发展现状
1.3 数据挖掘预备知识
1.4 数据挖掘的基本流程
1.5 数据挖掘工作环境
第2章 科学计算库NumPy
2.1 ndarray 对象
2.1.1 ndarray的属性
2.1.2 ndarray的数据类型
2.1.3 ndarray 的创建
2.1.4 ndarray的操作
2.2 伪随机数生成
2.2.1 rand函数
2.2.2 randn函数
2.2.3 randint函数
2.2.4 uniform函数
2.2.5 normal函数
2.2.6 choice函数
2.3 索引和切片
2.3.1 索引
2.3.2 花式索引
2.3.3 切片
2.3.4 布尔型索引
2.4 NumPy运算
2.4.1 元素级运算
2.4.2 广播
2.4.3 通用函数
2.4.4 meshgrid函数
2.4.5 排序
2.4.6 统计函数
2.5 线性代数工具
2.5.1 diag函数
2.5.2 矩阵乘积
2.5.3 矩阵行列式
2.5.4 特征值和特征向量
2.5.5 求解线性方程组
2.6 数组的文件输入和输出
2.6.1 读写文本文件
2.6.2 读写二进制文件
第3章 绘图与可视化
3.1 可视化的基本概念
3.2 Matplotlib绘图
3.2.1 线型图
3.2.2 散点图
3.2.3 条形图
3.2.4 直方图
3.2.5 饼图
3.2.6 箱线图
3.2.7 等高线图
3.3 Seaborn绘图
3.3.1 分布图
3.3.2 关系图
3.3.3 分类图
3.3.4 回归图
3.3.5 热力图
3.3.6 分面网格图
第4章 数据分析库Pandas
4.1 数据类型
4.1.1 Series类型
4.1.2 DataFrame类型
4.2 统计函数
4.2.1 常用统计函数
4.2.2 面元划分
4.2.3 相关系数
4.3 缺失值处理
4.3.1 查看缺失数据
4.3.2 删除缺失数据
4.3.3 填充缺失数据
4.4 重复值处理
4.4.1 查询重复数据
4.4.2 删除重复数据
4.5 异常值处理
4.6 随机采样
4.7 数据转换
4.7.1 map
4.7.2 apply
4.7.3 applymap
4.7.4 replace
4.8 合并与拼接
4.8.1 merge
4.8.2 concat
4.8.3 combine_first
4.9 数据重塑
4.9.1 stack
4.9.2 unstack
4.10 数据分组与聚合
4.10.1 分组
4.10.2 聚合
4.11 透视表
4.12 数据加载与存储
4.12.1 文本文件的加载与存储
4.12.2 电子表格文件的加载与存储
第5章 数据预处理
5.1 数据清洗
5.1.1 缺失值处理
5.1.2 异常值处理
5.1.3 重复值处理
5.2 不均衡数据处理
5.2.1 过采样
5.2.2 欠采样
5.3 数据变换
5.3.1 特征缩放
5.3.2 特征编码
5.3.3 数值离散化
第6章 特征工程
6.1 特征选择
6.1.1 过滤法
6.1.2 包装法
6.1.3 嵌入法
6.2 特征降维
6.2.1 主成分分析
6.2.2 线性判别分析
第7章 数据建模
7.1 基础知识
7.1.1 数据集划分
7.1.2 抽样方法
7.1.3 偏差和方差
7.1.4 过拟合和欠拟合
7.1.5 算法分类
7.2 回归算法
7.2.1 线性回归
7.2.2 岭回归
7.2.3 套索回归
7.2.4 多项式回归
7.3 分类算法
7.3.1 决策树
7.3.2 随机森林
7.3.3 逻辑回归
7.3.4 k近邻
7.3.5 朴素贝叶斯
7.4 聚类算法
7.4.1 k均值
7.4.2 DBSCAN
第8章 参数优化与模型评估
8.1 参数优化
8.2 模型评估
8.2.1 回归模型评估
8.2.2 分类模型评估
8.2.3 聚类模型评估
参考文献
展开全部
书友推荐
- >
有舍有得是人生
有舍有得是人生
¥25.7¥45.0 - >
唐代进士录
唐代进士录
¥16.1¥39.8 - >
经典常谈
经典常谈
¥16.7¥39.8 - >
月亮虎
月亮虎
¥15.4¥48.0 - >
中国人在乌苏里边疆区:历史与人类学概述
中国人在乌苏里边疆区:历史与人类学概述
¥21.6¥48.0 - >
姑妈的宝刀
姑妈的宝刀
¥15.7¥30.0 - >
企鹅口袋书系列·伟大的思想20:论自然选择(英汉双语)
企鹅口袋书系列·伟大的思想20:论自然选择(英汉双语)
¥6.3¥14.0 - >
我从未如此眷恋人间
我从未如此眷恋人间
¥16.9¥49.8
本类畅销
-
大数据技术导论(第2版)
¥28.9¥41 -
计算机组成原理实验指导与习题解析
¥34.8¥52 -
数据结构教程(第6版·微课视频·题库版)
¥45.9¥65 -
MATLAB基础及应用
¥30.9¥49.8 -
DREAMWEAVER网页设计制作项目教程
¥21.3¥39 -
C#程序设计
¥20.6¥45.6
浏览历史
一千零一夜-小树苗儿童成长经典阅读宝库-珍藏版
¥20.1¥39.0告诉我什么是时间?-藏在身边的科学
¥9.0¥20.0改革共识与中国未来
¥13.9¥38.0数学-同步练习与测试评价-下册-(基础模块)
¥6.2¥8.8容忍与自由 胡适演讲精选
¥12.2¥35.0