数据有道 数据分析+图论与网络+微课+Python编程 版权信息
- ISBN:9787302671572
- 条形码:9787302671572 ; 978-7-302-67157-2
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
数据有道 数据分析+图论与网络+微课+Python编程 本书特色
这是一本前所未见的数据入门书,颜值极高。姜伟生博士自谦“小镇做题家”,实际上他是国际著名金融企业的金融科技专家。很难想象一位以“术数”为业的金融家具备如此彻底的分享动机,同时,姜博士有着卓越的艺术品位和设计能力,不仅承担了这套书的精深内容,更承担了全系图书的整体设计。希望读者从枯燥的常规数学书中解脱出来,赏心悦目地慢慢走入缤纷的AI宇宙。
数据有道 数据分析+图论与网络+微课+Python编程 内容简介
本书是“鸢尾花数学大系——从加减乘除到机器学习”丛书的第三板块(实践板块)中的一本关于数据科学的分册。“实践”这个板块,我们将会把学到的编程、可视化,特别是数学工具应用到具体的数据科学、机器学习算法中,并在实践中加深对这些工具的理解。
本书可以归纳为7大板块——数据说、数据处理、时间数据、图论基础、图的分析、图与矩阵、图论实践。这7个板块(共25章内容)都紧紧围绕一个主题——数据!
本书以数据为名,以好奇心和疑问为驱动,主动使用“编程+可视化+数学”工具进行探索。本书将会回顾鸢尾花书前五本主要的工具,让大家对很多概念从似懂非懂变成如数家珍;同时,我们还会掌握更多工具,用来扩展大家的知识网络。
依照惯例,本书提供代码和视频教学。
本书读者群包括数据科学从业者、大数据从业者、高级数据分析师、机器学习开发者、计算机图形学研究者等。
数据有道 数据分析+图论与网络+微课+Python编程 目录
绪论 1
**板块 综述5
第 1章 万物皆数 7
1.1 万物皆数:从矩阵说起 8
1.2 数据分类:定量 ( 连续、离散 ) 、定性 ( 定类、定序 ) 14
1.3 机器学习:四大类算法 17
1.4 特征工程:提取、转换、构建数据 21
第2板块 数据处理23
第 2章 缺失值 25
2.1 是不是缺了几个数? 26
2.2 可视化缺失值位置 30
2.3 处理缺失值:删除 34
2.4 单变量插补 37
2.5 k 近邻插补 39
2.6 多变量插补 41
第 3章 离群值 43
3.1 这几个数有点不合群? 44
3.2 直方图:单一特征分布 46
3.3 散点图:成对特征分布 49
3.4 QQ 图:分位数 - 分位数 51
3.5 箱型图:上界、下界之外样本 54
3.6 Z 分数:样本数据标准化 55
3.7 马氏距离和其他方法 57
第4章 数据转换 63
4.1 数据转换 64
4.2 中心化:去均值 65
4.3 标准化:Z 分数 69
4.4 归一化:取值在 0 和 1 之间 71
4.5 广义幂转换 72
4.6 经验累积分布函数 74
4.7 插值 79
第 5章 数据距离 91
5.1 怎么又聊距离? 92
5.2 欧氏距离:*常见的距离 94
5.3 标准化欧氏距离:考虑标准差 96
5.4 马氏距离:考虑标准差和相关性 99
5.5 城市街区距离:L1 范数 101
5.6 切比雪夫距离:L ∞范数 102
5.7 闵氏距离:Lp 范数 103
5.8 距离与亲近度 104
5.9 成对距离、成对亲近度 108
5.10 协方差矩阵,为什么无处不在? 110
第3板块 时间数据127
第6 时间数据 129
6.1 时间序列数据 130
6.2 处理时间序列缺失值 133
6.3 从时间数据中发现趋势 135
6.4 时间序列分解 138
6.5 时间数据讲故事 143
第 7章 移动窗口 157
7.1 移动窗口 158
7.2 移动波动率 162
7.3 相关性 165
7.4 回归系数 166
7.5 指数加权移动平均 167
7.6 EWMA 波动率 169
第 8章 随机过程入门 175
8.1 布朗运动:来自花粉颗粒无规则运动 176
8.2 无漂移布朗运动 180
8.3 漂移布朗运动:确定 随机 182
8.4 具有一定相关性的布朗运动 185
8.5 几何布朗运动 188
8.6 股价模拟 190
8.7 相关股价模拟 193
第 9章 高斯过程 197
9.1 高斯过程原理 198
9.2 协方差矩阵 202
9.3 分块协方差矩阵 206
9.4 后验 206
9.5 噪声 210
9.6 核函数 211
第4板块 图论基础223
第 10章 图论入门 225
10.1 什么是图? 226
10.2 图和几何 233
10.3 图和矩阵 234
10.4 图和机器学习 236
10.5 NetworkX 241
第 11章 无向图 243
11.1 无向图:边没有方向 244
11.2 自环:节点到自身的边 248
11.3 同构:具有等价关系的图 250
11.4 多图:同一对节点存在不止一条边 253
11.5 子图:图的一部分 254
11.6 有权图:边自带权重 256
第 12章 有向图 261
12.1 有向图:边有方向 262
12.2 出度、入度 265
12.3 邻居:上家、下家 266
12.4 有向多图:平行边 267
12.5 三元组:三个节点的 16 种关系 269
12.6 NetworkX 创建图 273
第 13章 图的可视化 281
13.1 节点位置 282
13.2 节点装饰 286
13.3 边装饰 289
13.4 分别绘制节点和边 291
第5板块 图的分析299
第 14章 常见图 301
14.1 常见图类型 302
14.2 完全图 303
14.3 二分图 307
14.4 正则图 310
14.5 树 311
14.6 柏拉图图 315
第 15章 从路径说起 321
15.1 通道、迹、路径、回路、环 322
15.2 常见路径问题 333
15.3 *短路径问题 334
15.4 欧拉路径 339
15.5 哈密尔顿路径 339
15.6 推销员问题 340
第 16章 连通性 343
16.1 连通性 344
16.2 连通分量 349
16.3 强连通、弱连通:有向图 352
16.4 桥 353
第 17章 图的分析 357
17.1 度分析 358
17.2 距离度量 363
17.3 中心性 372
17.4 图的社区 380
第6板块 图与矩阵 383
第 18章 从图到矩阵 385
18.1 无向图到邻接矩阵 386
18.2 有向图到邻接矩阵 397
18.3 传球问题 399
18.4 邻接矩阵的矩阵乘法 406
18.5 特征向量中心性 409
第 19章 成对度量矩阵 413
19.1 成对距离矩阵 414
19.2 亲近度矩阵:高斯核函数 420
19.3 相关性系数矩阵 424
第 20章 转移矩阵 429
20.1 再看邻接矩阵 430
20.2 转移矩阵:可能性 435
20.3 有向图 436
20.4 马尔可夫链 442
第 21章 其他矩阵 449
21.1 图中常见矩阵 450
21.2 关联矩阵 450
21.3 度矩阵 462
21.4 拉普拉斯矩阵 464
第7板块 图论实践 475
第 22章 树 477
22.1 树 478
22.2 *近共同祖先 484
22.3 *小生成树 485
22.4 决策树:分类算法 487
22.5 层次聚类 490
22.6 树形图:聚类算法 496
第 23章 数据聚类 499
23.1 数据聚类 500
23.2 距离矩阵 502
23.3 相似度 504
23.4 无向图 506
23.5 拉普拉斯矩阵 507
23.6 特征值分解 509
第 24章 PageRank算法 513
24.1 PageRank 算法 514
24.2 线性方程组 522
24.3 幂迭代 526
第 25章 社交网络分析 533
25.1 社交网络分析 534
25.2 度分析 536
25.3 图距离 538
25.4 中心性 542
25.5 社区结构 547
展开全部
数据有道 数据分析+图论与网络+微课+Python编程 作者简介
姜伟生 博士 FRM。
勤奋的小镇做题家,热爱知识可视化和开源分享。自2022年8月开始,在GitHub上开源“鸢尾花书”学习资源,截至2024年5月,已经分享5000多页PDF、5000多幅矢量图、约3000个代码文件,全球读者数以万计,GitHub全球排名TOP100。