扫一扫
关注中图网
官方微博
本类五星书更多>
-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
R语言数据挖掘实用项目解析 版权信息
- ISBN:9787111565208
- 条形码:9787111565208 ; 978-7-111-56520-8
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 所属分类:>>
R语言数据挖掘实用项目解析 本书特色
本书将阐述数据挖掘的一些主题,如数学表述、在软件中的实现,以及如何据此来解决商业问题。本书旨在让读者可以从数据管理技术、探索性数据分析、数据可视化等内容着手学习,循序渐进,直至建立高级预测模型。本书也从数据科学、分析学、统计建模以及可视化等角度对数据挖掘这一概念进行了综述。
R语言数据挖掘实用项目解析 内容简介
本书将阐述数据挖掘的一些主题,如数学表述、在软件中的实现,以及如何据此来解决商业问题。本书旨在让读者可以从数据管理技术、探索性数据分析、数据可视化等内容着手学习,循序渐进,直至建立高级预测模型。本书也从数据科学、分析学、统计建模以及可视化等角度对数据挖掘这一概念进行了综述。
R语言数据挖掘实用项目解析 目录
目 录?Contents
译者序
前言
第1章 使用R内置数据进行数据处理 1
1.1 什么是数据挖掘 2
1.2 R语言引论 4
1.2.1 快速入门 4
1.2.2 数据类型、向量、数组与矩阵 4
1.2.3 列表管理、因子与序列 7
1.2.4 数据的导入与导出 8
1.3 数据类型转换 10
1.4 排序与合并数据框 11
1.5 索引或切分数据框 15
1.6 日期与时间格式化 16
1.7 创建新函数 17
1.7.1 用户自定义函数 17
1.7.2 内置函数 18
1.8 循环原理——for循环 18
1.9 循环原理——repeat循环 19
1.10 循环原理——while循环 19
1.11 apply原理 19
1.12 字符串操作 21
1.13 缺失值(NA)的处理 22
小结 23
第2章 汽车数据的探索性分析 24
2.1 一元分析 24
2.2 二元分析 30
2.3 多元分析 31
2.4 解读分布和变换 32
2.4.1 正态分布 32
2.4.2 二项分布 34
2.4.3 泊松分布 34
2.5 解读分布 34
2.6 变量分段 37
2.7列联表、二元统计及数据正态性检验 37
2.8 假设检验 41
2.8.1 总体均值检验 42
2.8.2 双样本方差检验 46
2.9 无参数方法 48
2.9.1 Wilcoxon符号秩检验 49
2.9.2 Mann-Whitney-Wilcoxon检验 49
2.9.3 Kruskal-Wallis检验 49
小结 50
第3章 可视化diamond数据集 51
3.1 使用ggplot2可视化数据 54
3.1.1 条状图 64
3.1.2 盒状图 65
3.1.3 气泡图 65
3.1.4 甜甜圈图 66
3.1.5 地理制图 67
3.1.6 直方图 68
3.1.7 折线图 68
3.1.8 饼图 69
3.1.9 散点图 70
3.1.10 堆叠柱形图 75
3.1.11 茎叶图 75
3.1.12 词云 76
3.1.13 锯齿图 76
3.2 使用plotly 78
3.2.1 气泡图 78
3.2.2 用plotly画条状图 79
3.2.3 用plotly画散点图 79
3.2.4 用plotly画盒状图 80
3.2.5 用plotly画极坐标图 82
3.2.6 用plotly画极坐标散点图 82
3.2.7 极坐标分区图 83
3.3 创建地理制图 84
小结 84
第4章 用汽车数据做回归 85
4.1 回归引论 85
4.1.1 建立回归问题 86
4.1.2 案例学习 87
4.2 线性回归 87
4.3 通过逐步回归法进行变量选取 98
4.4 Logistic回归 99
4.5 三次回归 105
4.6 惩罚回归 106
小结 109
第5章 基于产品数据的购物篮分析 110
5.1 购物篮分析引论 110
5.1.1 什么是购物篮分析 111
5.1.2 哪里会用到购物篮分析 112
5.1.3 数据要求 112
5.1.4 前提假设/要求 114
5.1.5 建模方法 114
5.1.6 局限性 114
5.2 实际项目 115
5.2.1 先验算法 118
5.2.2 eclat算法 121
5.2.3 可视化关联规则 123
5.2.4 实施关联规则 124
小结 126
第6章 聚类电商数据 127
6.1 理解客户分类 128
6.1.1 为何理解客户分类很重要 128
6.1.2 如何对客户进行分类 128
6.2 各种适用的聚类方法 129
6.2.1 K均值聚类 130
6.2.2 层次聚类 135
6.2.3 基于模型的聚类 139
6.2.4 其他聚类算法 140
6.2.5 聚类方法的比较 143
参考文献 143
小结 143
第7章 构建零售推荐引擎 144
7.1 什么是推荐 144
7.1.1 商品推荐类型 145
7.1.2 实现推荐问题的方法 145
7.2 前提假设 147
7.3 什么时候采用什么方法 148
7.4 协同过滤的局限 149
7.5 实际项目 149
小结 157
第8章 降维 158
8.1 为什么降维 158
8.2 降维实际项目 161
8.3 有参数法降维 172
参考文献 173
小结 173
第9章 神经网络在医疗数据中的应用 174
9.1 神经网络引论 174
9.2 理解神经网络背后的数学原理 176
9.3 用R语言实现神经网络 177
9.4 应用神经网络进行预测 180
9.5 应用神经网络进行分类 183
9.6 应用神经网络进行预测 185
9.7 神经网络的优缺点 187
参考文献 187
小结 187
译者序
前言
第1章 使用R内置数据进行数据处理 1
1.1 什么是数据挖掘 2
1.2 R语言引论 4
1.2.1 快速入门 4
1.2.2 数据类型、向量、数组与矩阵 4
1.2.3 列表管理、因子与序列 7
1.2.4 数据的导入与导出 8
1.3 数据类型转换 10
1.4 排序与合并数据框 11
1.5 索引或切分数据框 15
1.6 日期与时间格式化 16
1.7 创建新函数 17
1.7.1 用户自定义函数 17
1.7.2 内置函数 18
1.8 循环原理——for循环 18
1.9 循环原理——repeat循环 19
1.10 循环原理——while循环 19
1.11 apply原理 19
1.12 字符串操作 21
1.13 缺失值(NA)的处理 22
小结 23
第2章 汽车数据的探索性分析 24
2.1 一元分析 24
2.2 二元分析 30
2.3 多元分析 31
2.4 解读分布和变换 32
2.4.1 正态分布 32
2.4.2 二项分布 34
2.4.3 泊松分布 34
2.5 解读分布 34
2.6 变量分段 37
2.7列联表、二元统计及数据正态性检验 37
2.8 假设检验 41
2.8.1 总体均值检验 42
2.8.2 双样本方差检验 46
2.9 无参数方法 48
2.9.1 Wilcoxon符号秩检验 49
2.9.2 Mann-Whitney-Wilcoxon检验 49
2.9.3 Kruskal-Wallis检验 49
小结 50
第3章 可视化diamond数据集 51
3.1 使用ggplot2可视化数据 54
3.1.1 条状图 64
3.1.2 盒状图 65
3.1.3 气泡图 65
3.1.4 甜甜圈图 66
3.1.5 地理制图 67
3.1.6 直方图 68
3.1.7 折线图 68
3.1.8 饼图 69
3.1.9 散点图 70
3.1.10 堆叠柱形图 75
3.1.11 茎叶图 75
3.1.12 词云 76
3.1.13 锯齿图 76
3.2 使用plotly 78
3.2.1 气泡图 78
3.2.2 用plotly画条状图 79
3.2.3 用plotly画散点图 79
3.2.4 用plotly画盒状图 80
3.2.5 用plotly画极坐标图 82
3.2.6 用plotly画极坐标散点图 82
3.2.7 极坐标分区图 83
3.3 创建地理制图 84
小结 84
第4章 用汽车数据做回归 85
4.1 回归引论 85
4.1.1 建立回归问题 86
4.1.2 案例学习 87
4.2 线性回归 87
4.3 通过逐步回归法进行变量选取 98
4.4 Logistic回归 99
4.5 三次回归 105
4.6 惩罚回归 106
小结 109
第5章 基于产品数据的购物篮分析 110
5.1 购物篮分析引论 110
5.1.1 什么是购物篮分析 111
5.1.2 哪里会用到购物篮分析 112
5.1.3 数据要求 112
5.1.4 前提假设/要求 114
5.1.5 建模方法 114
5.1.6 局限性 114
5.2 实际项目 115
5.2.1 先验算法 118
5.2.2 eclat算法 121
5.2.3 可视化关联规则 123
5.2.4 实施关联规则 124
小结 126
第6章 聚类电商数据 127
6.1 理解客户分类 128
6.1.1 为何理解客户分类很重要 128
6.1.2 如何对客户进行分类 128
6.2 各种适用的聚类方法 129
6.2.1 K均值聚类 130
6.2.2 层次聚类 135
6.2.3 基于模型的聚类 139
6.2.4 其他聚类算法 140
6.2.5 聚类方法的比较 143
参考文献 143
小结 143
第7章 构建零售推荐引擎 144
7.1 什么是推荐 144
7.1.1 商品推荐类型 145
7.1.2 实现推荐问题的方法 145
7.2 前提假设 147
7.3 什么时候采用什么方法 148
7.4 协同过滤的局限 149
7.5 实际项目 149
小结 157
第8章 降维 158
8.1 为什么降维 158
8.2 降维实际项目 161
8.3 有参数法降维 172
参考文献 173
小结 173
第9章 神经网络在医疗数据中的应用 174
9.1 神经网络引论 174
9.2 理解神经网络背后的数学原理 176
9.3 用R语言实现神经网络 177
9.4 应用神经网络进行预测 180
9.5 应用神经网络进行分类 183
9.6 应用神经网络进行预测 185
9.7 神经网络的优缺点 187
参考文献 187
小结 187
展开全部
书友推荐
- >
罗庸西南联大授课录
罗庸西南联大授课录
¥13.8¥32.0 - >
有舍有得是人生
有舍有得是人生
¥16.7¥45.0 - >
史学评论
史学评论
¥23.2¥42.0 - >
人文阅读与收藏·良友文学丛书:一天的工作
人文阅读与收藏·良友文学丛书:一天的工作
¥19.2¥45.8 - >
小考拉的故事-套装共3册
小考拉的故事-套装共3册
¥36.7¥68.0 - >
苦雨斋序跋文-周作人自编集
苦雨斋序跋文-周作人自编集
¥6.9¥16.0 - >
山海经
山海经
¥21.1¥68.0 - >
随园食单
随园食单
¥15.4¥48.0
本类畅销
-
一本书读懂大数据
¥13.5¥36 -
4.23文创礼盒A款--“作家言我精神状态”
¥42.3¥206 -
4.23文创礼盒B款--“作家言我精神状态”
¥42.3¥206 -
一句顶一万句 (印签版)
¥40.4¥68 -
百年书评史散论
¥14.9¥38 -
1980年代:小说六记
¥52.8¥69