目录
**篇 概论篇
3 / 1 大数据治理概论
1.1 大数据治理背景……………………………………………………………… (3)
1.2 大数据治理相关概念………………………………………………………… (5)
1.3 大数据治理框架……………………………………………………………… (9)
1.4 大数据治理原则 …………………………………………………………… (10)
1.5 大数据治理方法 …………………………………………………………… (13)
21 / 2 大数据治理应用
2.1 新冠肺炎疫情防控与复工案例 …………………………………………… (21)
2.2 中国人民银行个人信用评分案例 ………………………………………… (23)
第二篇 数据预处理篇
29 / 3 实训项目1: 期货数据预处理
3.1 项目背景 …………………………………………………………………… (29)
3.2 实训目标 …………………………………………………………………… (29)
3.3 实训任务 …………………………………………………………………… (29)
3.4 技术准备 …………………………………………………………………… (30)
3.5 实训步骤 …………………………………………………………………… (44)
3.6 项目总结 …………………………………………………………………… (51)
3.7 课后扩展 …………………………………………………………………… (51)
52 / 4 实训项目2: 电影数据预处理
4.1 项目背景 …………………………………………………………………… (52)
4.2 实训目标 …………………………………………………………………… (52)
4.3 实训任务 …………………………………………………………………… (52)
4.4 技术准备 …………………………………………………………………… (53)
4.5 实训步骤 …………………………………………………………………… (63)
4.6 项目总结 …………………………………………………………………… (68)
4?? 7 课后扩展 …………………………………………………………………… (68)
69 / 5 实训项目3: 人力资源数据预处理
5.1 项目背景 …………………………………………………………………… (69)
5.2 实训目标 …………………………………………………………………… (69)
5.3 实训任务 …………………………………………………………………… (69)
5.4 技术准备 …………………………………………………………………… (70)
5.5 实训步骤 …………………………………………………………………… (78)
5.6 项目总结 …………………………………………………………………… (81)
5.7 课后扩展 …………………………………………………………………… (82)
83 / 6 实训项目4: 鸢尾花数据预处理
6.1 项目背景 …………………………………………………………………… (83)
6.2 实训目标 …………………………………………………………………… (83)
6.3 实训任务 …………………………………………………………………… (83)
6.4 技术准备 …………………………………………………………………… (84)
6.5 实训步骤 …………………………………………………………………… (86)
6.6 项目总结 …………………………………………………………………… (90)
6.7 课后扩展 …………………………………………………………………… (90)
第三篇 数据可视化篇
93 / 7 实训项目5: 泰坦尼克号数据可视化
7.1 项目背景 …………………………………………………………………… (93)
7.2 实训目标 …………………………………………………………………… (93)
7.3 实训任务 …………………………………………………………………… (93)
7.4 技术准备 …………………………………………………………………… (94)
7.5 实训步骤 ………………………………………………………………… (105)
7.6 项目总结 ………………………………………………………………… (113)
7.7 课后扩展 …………………………………………………………………… (113)
114/ 8 实训项目6: 人力资源数据可视化
8.1 项目背景 ………………………………………………………………… (114)
8.2 实训目标 ………………………………………………………………… (114)
8.3 实训任务 ………………………………………………………………… (114)
8.4 技术准备 ………………………………………………………………… (115)
8.5 实训步骤 ………………………………………………………………… (115)
8.6 项目总结 ………………………………………………………………… (125)
8.7 课后扩展 ………………………………………………………………… (125)
126/ 9 实训项目7: 电影数据可视化
9.1 项目背景 ………………………………………………………………… (126)
9.2 实训目标 ………………………………………………………………… (126)
9.3 实训任务 ………………………………………………………………… (127)
9.4 技术准备 ………………………………………………………………… (127)
9.5 实训步骤 ………………………………………………………………… (128)
9.6 项目总结 …………………………………………………………………… (140)
9.7 课后扩展 …………………………………………………………………… (140)
第四篇 数据挖掘篇
143/ 10 实训项目8: 人力资源数据挖掘
10.1 项目背景 ……………………………………………………………… (143)
10.2 实训目标 ……………………………………………………………… (143)
10.3 实训任务 ……………………………………………………………… (143)
10.4 技术准备 ……………………………………………………………… (144)
10.5 实训步骤 ……………………………………………………………… (150)
10.6 项目总结 ……………………………………………………………… (160)
10.7 课后扩展 ……………………………………………………………… (160)
161/ 11 实训项目9: 健康数据挖掘
11.1 项目背景 ……………………………………………………………… (161)
11.2 学习目标 ……………………………………………………………… (161)
11.3 实训任务 ……………………………………………………………… (161)
11.4 技术准备 ……………………………………………………………… (162)
11.5 实训步骤 ………………………………………………………………… (163)
11.6 项目总结 ……………………………………………………………… (178)
11.7 课后扩展 ……………………………………………………………… (178)
第五篇 综合实训篇
181/ 12 实训项目10: 美团美食店铺数据分析实训
12.1 项目背景 ……………………………………………………………… (181)
12.2 实训目标 ……………………………………………………………… (181)
12.3 实训任务 ……………………………………………………………… (181)
12.4 技术准备 ……………………………………………………………… (182)
12.5 数据准备与预处理 …………………………………………………… (188)
12.6 美食店铺基本情况分析与可视化 …………………………………… (190)
12.7 基于 K-means 算法的店铺分类模型构建 ………………… (196)
12.8 基于有监督的机器学习的用户情感分类 ……………………………… (200)
12.9 项目总结 ……………………………………………………………… (205)
12.10 课后扩展 …………………………………………………………… (205)
206/ 13 实训项目11: 交通大数据分析实训
13.1 项目背景 ……………………………………………………………… (206)
13.2 实训目标 ……………………………………………………………… (206)
13.3 实训任务 ……………………………………………………………… (206)
13.4 技术准备 ……………………………………………………………… (207)
13.5 数据准备与预处理 …………………………………………………… (211)
13.6 骑行数据探索性分析 ………………………………………………… (220)
13.7 骑行数据可视化分析 ………………………………………………… (222)
13.8 基于 Apriori 算法和 FPGrowth 算法的关联规则挖掘…………………… (225)
13.9 项目总结 ……………………………………………………………… (232)
13.10 课后扩展 ……………………………………………………………… (232)
233/ 参考文献