书馨卡帮你省薪 2024个人购书报告 2024中图网年度报告
欢迎光临中图网 请 | 注册

决策算法

出版社:机械工业出版社出版时间:2024-08-01
开本: 16开 页数: 467
中 图 价:¥99.8(6.7折) 定价  ¥149.0 登录后可看到会员价
加入购物车 收藏
运费6元,满39元免运费
?新疆、西藏除外
本类五星书更多>

决策算法 版权信息

  • ISBN:9787111756583
  • 条形码:9787111756583 ; 978-7-111-75658-3
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 所属分类:>

决策算法 本书特色

本书源于斯坦福大学的课程“不确定性状态下的决策”,主要介绍不确定状态下的决策算法,涵盖基本的数学问题和求解算法。本书主要关注规划和强化学习,其中一些技术涉及监督学习和优化。书中的算法是用Julia编程语言实现的,并配有大量图表、示例和练习题。

决策算法 内容简介

本书源于斯坦福大学的课程“不确定性状态下的决策”,主要介绍不确定状态下的决策算法,涵盖基本的数学问题和求解算法。本书主要关注规划和强化学习,其中一些技术涉及监督学习和优化。书中的算法是用Julia编程语言实现的,并配有大量图表、示例和练习题。 本书共分为五个部分:首先解决在单个时间点上简单决策的不确定性和目标的推理问题;然后介绍随机环境中的序列决策问题;接着讨论模型不确定性,包括基于模型的方法和无模型的方法;之后讨论状态不确定性,包括精确信念状态规划、离线信念状态规划、在线信念状态规划等;*后讨论多智能体系统,涉及多智能体推理和协作智能体等。

决策算法 目录

目录 Algorithms for Decision Making 译者序 前言 致谢 第1章导论1 11决策1 12应用2 121飞机防撞控制系统2 122自动驾驶控制系统2 123乳腺癌筛查2 124金融消费与投资组合配置3 125分布式森林火灾监控系统3 126火星科学探测3 13方法3 131显式编程4 132监督式学习4 133优化4 134规划4 135强化学习4 14自动化决策过程的历史4 141经济学5 142心理学6 143神经科学6 144计算机科学6 145工程7 146数学7 147运筹学8 15社会影响8 16本书组织结构9 161概率推理9 162序列问题9 163模型不确定性10 164状态不确定性10 165多智能体系统10 **部分概率推理 第2章表示12 21信念度和概率12 22概率分布12 221离散概率分布13 222连续概率分布13 23联合分布16 231离散联合分布16 232连续联合分配19 24条件分布20 241离散条件模型21 242条件高斯模型21 243线性高斯模型22 244条件线性高斯模型22 245sigmoid模型22 246确定性变量22 25贝叶斯网络23 26条件独立性25 27本章小结26 28练习题27 第3章推理30 31贝叶斯网络中的推理30 32朴素贝叶斯模型中的推理33 33“和积”变量消除35 34信念传播36 35计算复杂度37 36直接抽样37 37似然加权抽样39 38吉布斯抽样41 39高斯模型中的推理43 310本章小结44 311练习题45 第4章参数学习49 41*大似然参数学习49 411类别分布的*大似然估计50 412高斯分布的*大似然估计50 413贝叶斯网络的*大似然估计51 42贝叶斯参数学习53 421二元分布的贝叶斯学习54 422类别分布的贝叶斯学习55 423贝叶斯网络的贝叶斯学习56 43非参数学习57 44缺失数据的学习58 441数据插值58 442期望*大化60 45本章小结62 46练习题62 第5章结构学习66 51贝叶斯网络评分66 52有向图搜索68 53马尔可夫等价类71 54部分有向图搜索72 55本章小结73 56练习题73 第6章简单决策75 61理性偏好上的约束75 62效用函数76 63效用诱导76 64*大期望效用原则78 65决策网络79 66信息价值81 67非理性82 68本章小结84 69练习题84 第二部分序列问题 第7章精确求解方法88 71马尔可夫决策过程88 72策略评估90 73值函数策略92 74策略迭代93 75值迭代94 76异步值迭代96 77线性规划方程98 78具有二次型奖励的线性系统99 79本章小结102 710练习题102 第8章近似值函数108 81参数化表示108 82*近邻109 83核平滑110 84线性插值112 85单纯形插值114 86线性回归116 87神经网络回归119 88本章小结119 89练习题120 第9章在线规划123 91滚动时域规划123 92基于预演的前瞻算法124 93正向搜索125 94分支定界法126 95稀疏抽样127 96蒙特卡罗树搜索128 97启发式搜索134 98标记启发式搜索136 99开环规划139 991确定性模型预测控制140 992鲁棒模型预测控制141 993多重预测模型预测控制142 910本章小结143 911练习题143 第10章策略搜索146 101近似策略评估146 102局部搜索147
展开全部

决策算法 作者简介

米凯尔·J. 科申德弗 (Mykel J. Kochenderfer) 斯坦福大学航空航天系和计算机科学系副教授,智能系统实验室(SISL)主任。曾任职于麻省理工学院林肯实验室。目前主要研究用于设计鲁棒决策系统的算法和分析方法。他拥有爱丁堡大学博士学位。 蒂姆·A. 惠勒 (Tim A. Wheeler) 软件工程师,主要从事自动驾驶、控制和决策系统方面的研发工作。他拥有斯坦福大学博士学位。 凯尔·H. 雷 (Kyle H. Wray) Robust AI 公司工程总监,曾任硅谷创新联盟实验室首席研究员,目前主要从事自主机器人的研发工作,致力于设计和实现机器人决策系统。他拥有马萨诸塞大学阿默斯特分校博士学位。

商品评论(0条)
暂无评论……
书友推荐
本类畅销
浏览历史
返回顶部
中图网
在线客服