机器学习的数学基础 版权信息
- ISBN:9787111763222
- 条形码:9787111763222 ; 978-7-111-76322-2
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 所属分类:
机器学习的数学基础 本书特色
理解机器学习所需的基本数学工具包括线性代数、解析几何、矩阵分解、向量微积分、优化、概率和统计。传统上,这些主题是在不同的课程中介绍的,这使得数据科学或计算机科学专业的学生或者专业人士很难有效地学习数学基础。本书弥补了纯数学书籍和机器学习书籍存在的单一性问题,介绍了理解机器学习的数学概念,并使用这些概念推导出了四种核心机器学习方法:线性回归、主成分分析、高斯混合模型和支持向量机。对于学生和其他具有数学背景的人来说,这些推导可以作为理解机器学习的一个起点。对于首次学习数学的人来说,这些方法有助于建立应用数学概念的直觉和实践经验。本书每一章都包括一些例子,大部分章还配有习题,以便读者检验和巩固所学知识。
机器学习的数学基础 内容简介
理解机器学习所需的基本数学工具包括线性代数、解析几何、矩阵分解、向量微积分、优化、概率和统计。传统上,这些主题是在不同的课程中介绍的,这使得数据科学或计算机科学专业的学生或者专业人士很难有效地学习数学基础。本书弥补了纯数学书籍和机器学习书籍存在的单一性问题,介绍了理解机器学习**的数学概念,并使用这些概念推导出了四种核心机器学习方法:线性回归、主成分分析、高斯混合模型和支持向量机。对于学生和其他具有数学背景的人来说,这些推导可以作为理解机器学习的一个起点。对于首次学习数学的人来说,这些方法有助于建立应用数学概念的直觉和实践经验。本书每一章都包括一些例子,大部分章还配有习题,以便读者检验和巩固所学知识。
机器学习的数学基础 目录
译者序前言符号表缩略语和首字母缩略词表**部分 数学基础第 1 章 引言与动机 21.1 寻找直观的词语 21.2 阅读本书的两种方法 3习题和反馈 6第 2 章 线性代数 72.1 线性方程组 92.2 矩阵122.2.1 矩阵加法与乘法 122.2.2 逆和转置 15译者序前言符号表缩略语和首字母缩略词表**部分 数学基础第 1 章 引言与动机 21.1 寻找直观的词语 21.2 阅读本书的两种方法 3习题和反馈 6第 2 章 线性代数 72.1 线性方程组 92.2 矩阵122.2.1 矩阵加法与乘法 122.2.2 逆和转置 152.2.3 标量乘法 162.2.4 线性方程组的简洁表示 172.3 解线性方程组 172.3.1 特解和通解 182.3.2 初等变换 192.3.3 -1 技巧 232.3.4 求解线性方程组的算法 252.4 向量空间 262.4.1 群 262.4.2 向量空间 272.4.3 向量子空间 292.5 线性无关 302.6 基与秩 342.6.1 生成集与基 342.6.2 秩 362.7 线性映射 372.7.1 线性映射的矩阵表示 392.7.2 基变换 422.7.3 象与核 472.8 仿射空间 492.8.1 仿射子空间 492.8.2 仿射映射 512.9 延伸阅读 51习题 52第 3 章 解析几何 603.1 范数613.2 内积623.2.1 点积 623.2.2 一般内积 623.2.3 对称正定矩阵 633.3 长度和距离 643.4 角度和正交性 663.5 标准正交基 683.6 正交补 693.7 函数内积 703.8 正交投影 713.8.1 一维子空间 (线) 的投影 723.8.2 投影到一般子空间上 753.8.3 Gram - Schmidt 正交化 783.8.4 在仿射子空间上的投影 793.9 旋转803.9.1 在 R2 上旋转 813.9.2 在 R3 上旋转 823.9.3 在 Rn 上旋转 833.9.4 旋转的性质 833.10 延伸阅读 84习题 84第 4 章 矩阵分解 874.1 行列式和迹 884.2 特征值和特征向量 944.3 Cholesky 分解 1014.4 特征分解和对角化 1034.5 奇异值分解 1064.5.1 SVD 的几何直观 1074.5.2 SVD 的构造 1104.5.3 特征分解与奇异值分解 1144.6 矩阵近似 1164.7 矩阵发展史 1204.8 延伸阅读 122习题 123第 5 章 向量微积分 1265.1 一元函数的微分 1285.1.1 泰勒级数 1295.1.2 求导法则 1325.2 偏微分和梯度 1335.2.1 偏微分的基本法则 1345.2.2 链式法则 1355.3 向量值函数的梯度 1365.4 矩阵梯度 1425.5 梯度计算中的常用等式 1455.6 反向传播与自动微分 1465.6.1 深度网络中的梯度 1465.6.2 自动微分 1485.7 高阶导数 1515.8 线性化和多元泰勒级数 1525.9 延伸阅读 157习题 157第 6 章 概率和分布 1606.1 概率空间的构造 1616.1.1 哲学问题 1616.1.2 概率与随机变量 1626.1.3 统计 1646.2 离散概率和连续概率 1656.2.1 离散概率 1656.2.2 连续概率 1666.2.3 离散分布和连续分布的对比 1686.3 加法法则、乘法法则和贝叶斯定理.1696.4 概要统计量和独立性 1726.4.1 均值与方差 1726.4.2 经验均值与协方差 1766.4.3 方差的三种表达 1776.4.4 随机变量的求和与变换 1786.4.5 统计独立性 1796.4.6 随机变量的内积 1806.5 高斯分布 1816.5.1 高斯分布的边缘分布和条件分布是高斯分布 1836.5.2 高斯密度的乘积 1856.5.3 求和与线性变换 1856.5.4 多元高斯分布抽样 1886.6 共轭与指数族 1886.6.1 共轭 1916.6.2 充分统计量 1936.6.3 指数族 1936.7 变量替换/逆变换 1966.7.1 分布函数技巧 1976.7.2 变量替换 1996.8 延伸阅读 202习题 203第 7 章 连续优化 2067.1 使用梯度下降的优化 2087.1.1 步长 2107.1.2 动量梯度下降法 2117.1.3 随机梯度下降 2117.2 约束优化和拉格朗日乘子 2137.3 凸优化 2167.3.1 线性规划 2197.3.2 二次规划 2217.3.3 Legendre-Fenchel变换和凸共轭 2227.4 延伸阅读 225习题 226第二部分 机器学习的核心问题第 8 章 模型结合数据 2308.1 数据、模型与学习 2308.1.1 用向量表示数据 2318.1.2 模型的函数表示 2338.1.3 模型的概率分布表示 2348.1.4 学习即寻找参数 2358.2 经验风险*小化 2368.2.1 函数的假设类别 2368.2.2 训练数据的损失函数 2378.2.3 正则化以减少过拟合 2388.2.4 用交叉验证评估泛化性能 2408.2.5 延伸阅读 2418.3 参数估计 2418.3.1 *大似然估计 2418.3.2 *大后验估计 2448.3.3 模型拟合 2458.3.4 延伸阅读 2468.4 概率建模与推理 2478.4.1 概率模型 2478.4.2 贝叶斯推理 2488.4.3 隐变量模型 2498.4.4 延伸阅读 2518.5 有向图模型 2518.5.1 图语义 2528.5.2 条件独立和 d 分离 2548.5.3 延伸阅读 2558.6 模型选择 2558.6.1 嵌套交叉验证 2568.6.2 贝叶斯模型选择 2578.6.3 模型比较的贝叶斯因子 2598.6.4 延伸阅读 260第 9 章 线性回归 2619.1 界定问题 2629.2 参数估计 2649.2.1 *大似然估计 2649.2.2 线性回归中的过拟合 2699.2.3 *大后验估计 2719.2.4 作为正则化的 MAP 估计 2739.3 贝叶斯线性回归 2749.3.1 模型 2759.3.2 先验预测 2759.3.3 后验分布 2779.3.4 后验预测 2799.3.5 边缘似然的计算 2819.4 *大似然作为正交投影 2839.5 延伸阅读 285第 10 章 用主成分分析进行降维 28710.1 提出问题 28810.2 *大化方差.29010.2.1 具有*大方差的方向 29110.2.2 具有*大方差的M 维子空间 29210.3 投影视角 29510.3.1 背景和目标 29510.3.2 寻找*优坐标 29710.3.3 寻找主子空间的基 29910.4 特征向量计算和低秩逼近 30210.4.1 PCA 使用低秩矩阵近似 30310.4.2 实践方面 30310.5 高维中的主成分分析 30410.6 主成分分析实践中的关键步骤 30510.7 隐变量视角 30810.7.1 生成过程和概率模型 30910.7.2 似然函数和联合分布 31010.7.3 后验分布 31110.8 延伸阅读 312第 11 章 高斯混合模型的密度估计 31611.1 高斯混合模型 31711.2 通过*大似然进行参数学习 31811.2.1 响应度 32011.2.2 更新均值 32111.2.3 更新协方差 32311.2.4 更新混合权重 32611.3 EM 算法 32811.4 隐变量视角 33111.4.1 生成过程与概率模型 33111.4.2 似然 33311.4.3 后验分布 33411.4.4 扩展到完整数据集 33411.4.5 再探 EM 算法 33511.5 延伸阅读 336第 12 章 用支持向量机进行分类 33812.1 分离超平面 34012.2 原始支持向量机 34112.2.1 间隔的概念 34212.2.2 间隔的传统推导 34412.2.3 为什么可以设定间隔的长度为 1 34512.2.4 软间隔 SVM:几何观点 34712.2.5 软间隔 SVM: 损失函数观点 34812.3 对偶支持向量机 35012.3.1 由拉格朗日乘子导出凸对偶 35112.3.2 对偶 SVM: 凸包观点35312.4 核35512.5 数值解 35712.6 延伸阅读 359参考文献 361
展开全部
机器学习的数学基础 作者简介
马克·彼得·戴森罗特(Marc Peter Deisenroth) 伦敦大学学院计算机科学系的 DeepMind人工智能主席、2012年欧洲强化学习研讨会(EWRL)的项目主席、2013年机器人科学与系统(RSS)研讨会的主席。他曾在伦敦帝国理工学院计算机系任教。他的研究领域包括数据高效学习、概率建模和自主决策,曾获得2014年国际机器人与自动化会议(ICRA)和2016年国际控制、自动化和系统会议(ICCAS)的最佳论文奖,是谷歌教师研究奖(Google Faculty Research Award)和微软博士资助的获得者。2018年,他被授予伦敦帝国理工学院杰出青年研究员总统奖(President's Award for Outstanding Early Career Researcher)。A. 阿尔多·费萨尔(A. Aldo Faisal) 马克·彼得·戴森罗特(Marc Peter Deisenroth) 伦敦大学学院计算机科学系的 DeepMind人工智能主席、2012年欧洲强化学习研讨会(EWRL)的项目主席、2013年机器人科学与系统(RSS)研讨会的主席。他曾在伦敦帝国理工学院计算机系任教。他的研究领域包括数据高效学习、概率建模和自主决策,曾获得2014年国际机器人与自动化会议(ICRA)和2016年国际控制、自动化和系统会议(ICCAS)的最佳论文奖,是谷歌教师研究奖(Google Faculty Research Award)和微软博士资助的获得者。2018年,他被授予伦敦帝国理工学院杰出青年研究员总统奖(President's Award for Outstanding Early Career Researcher)。A. 阿尔多·费萨尔(A. Aldo Faisal) 伦敦帝国理工学院大脑和行为实验室的负责人、该学院生物工程和计算系的教师、数据科学研究所的研究员。他是UKRI医疗保健人工智能博士培训中心的主任。他在德国比勒费尔德大学修了计算机科学和物理学专业,在剑桥大学获得计算神经科学博士学位后成为计算和生物学习实验室的一位初级研究员。他研究的是神经科学和机器学习的交叉领域,以理解人类大脑和行为并对其进行逆向工程。翁承顺(Cheng Soon Ong)堪培拉联邦科学与工业研究组织(CSIRO)Data61机器学习研究小组的首席研究科学家、澳大利亚国立大学的兼职副教授。他的研究重点是通过扩展统计机器学习方法来实现科学发现。他于2005年在澳大利亚国立大学获得计算机科学博士学位,曾在苏黎世联邦理工学院计算机科学系担任讲师,在墨尔本NICTA的诊断基因组学团队工作。