超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

不再提示
关闭
图书盲袋,以书为“药”
欢迎光临中图网 请 | 注册
> >
不确定条件下的决策:理论和应用:theory and application

不确定条件下的决策:理论和应用:theory and application

出版社:哈尔滨工业大学出版社出版时间:2020-10-01
开本: 16开 页数: 304页
本类榜单:教材销量榜
中 图 价:¥35.4(6.1折) 定价  ¥58.0 登录后可看到会员价
加入购物车 收藏
运费6元,满39元免运费
?新疆、西藏除外
本类五星书更多>

不确定条件下的决策:理论和应用:theory and application 版权信息

  • ISBN:9787560385068
  • 条形码:9787560385068 ; 978-7-5603-8506-8
  • 装帧:简裝本
  • 册数:暂无
  • 重量:暂无
  • 所属分类:>

不确定条件下的决策:理论和应用:theory and application 内容简介

《不确定条件下的决策:理论和应用》共12章,分为理论与应用两大部分,围绕设计决策智能体的两种主要方法(规划和强化学开。对不确定条件下的决策理论与应用的新研行了系统且全面的介绍,从计算的角度介绍了在不确定条件行决策的挑战括决策模型和算法背后的理论,以及从语音识别到飞机避碰的一系列应用。
《不确定条件下的决策:理论和应用》既可作为计算机科学、航空航天、电子与电气工程以及管理科学等专业高年级本科生和研究生的教材,也可作为相关领域研究人员的参考资料。

不确定条件下的决策:理论和应用:theory and application不确定条件下的决策:理论和应用:theory and application 前言

本书从计算的角度介绍了不确定条件下的决策问题及方法。书中**部分介绍了概率模型和决策理论的基础,第二部分讨论了上述理论在各种任务领域中的应用。不确定条件下的决策起源于几个不同领域,其应用范围相当广泛。本书旨在尽可能简单且广泛地提供与应用相关的材料,以供读者参考。

本书的目标读括在工程领行学究的本科生、研究生以及相关专业人士,尤其是计算机科学、航空航天、电子与电气工程和管理科学等学科。全书旨在介绍问题的本质,概述了算法,但省略了证明过程。本书的学一些数学基础,并且假定读者先行学率论和微积分。前5章可用作本科生或研究生课程的基础读物;第6章和第7章更适合研究生阅读学8~pan style="font-family:宋体">章给出了前述理论的部分应用实例。

本书是作者在林肯实验室工作期间历时两年完成的。林肯实验室是麻省理工学院(MIT)下受联邦资助的研发中心。作者在教授“不确定条件下的决策”这门课时,被“林肯实验室系列丛书”的成员邀请出版该书。书中大部分材料来自于该课程。课程的后半部分括林肯实验室及MIT校内研究人员的讲稿,目的是向读者展示如何应用课程**部分讨论的原理和技术解决涉及的问题。

Mykel J. KochendeI!fer

于美国加州福

20pan style="font-family:宋体">年2月6日

不确定条件下的决策:理论和应用:theory and application 目录

第1章 绪论
1.1 决策
1.2 应用实例
1.3 设计决策智能体的方法
1.4 结构安排
1.5 扩展阅读
参考文献
**部分 理论
第2章 概率模型
2.1 表示
2.2 推理
2.3 参数学
2.4 结构学
2.5 小结
2.6 扩展阅读
参考文献
第3章 决策问题
3.1 效用理论
3.2 决策网络
3.3 博弈问题
3.4 小结
3.5 扩展阅读
参考文献
第4章 序贯问题
4.1 构想
4.2 动态规划
4.3 结构化表示
4.4 线性表示
4.5似动态规划
4.6 在线方法
4.7 直接策略搜索
4.8 小结
4.9 扩展阅读
参考文献
第5章 模型的不确定性
5.1 探索和利用
5.2 基于似然模型的方法
5.3 基于模型的贝叶斯方法
5.4 无模型方法
5.5 泛化
5.6 小结
5.7 扩展阅读
参考文献
第6章 状态的不确定性
6.1 数学表达
6.2 状态更新
6.3 求解方法
6.4 离线方法
6.5 在线方法
6.6 小结
6.7 扩展阅读
参考文献
第7章 协同决策
7.1 数学表达
7.2 性质
7.3 代表性子类
7.4 求解的方法
7.5 似解的方法
7.6 通信
7.7 小结
7.8 扩展阅读
参考文献

第二部分 应用
第8章 基于概率的检测
8.1 基于特征的人员搜索
8.2 概率式的外表模型
8.3 学断技术
8.4 性能
8.5 交互式搜索工具
8.6 小结
参考文献
第9章 语音应用的动态模型
9.1 语音信号建模
9.2 语音识别
9.3 主题识别
9.4 语言识别
9.5 说话者识别
9.6 机器翻译
9.7 小结
参考文献
第10章 机载防撞优化系统
10.1 机载防撞系统
10.2 防撞问题的表达
10.3 状态估计
10.4 实时执行
10.5 评价
10.6 小结
参考文献
第11章 持续监测的多智能体规划
11.1 任务描述
11.2 集中问题的表达
11.3 分散问题似表达
11.4 模型学
11.5 飞行测试
11.6 小结
参考文献
第12章 人机自动化集成
12.1 人的能力及其应对
12.2 设计中人为因素的考量
12.3 实现的系统级视角
12.4 小结
参考文献

名词索引
附录 部分彩图
展开全部

不确定条件下的决策:理论和应用:theory and application 节选

1-3设计决策智能体的方法

设计决策智能体有许多不同的方法。在特定的应用情形下,有些方法可能比其他方法更合适,这些方法会因设计者的任务和留给自动处理的任务而有所不同。本书主要探讨规划和强化学,有些技术也会涉及监督学化的元素。

pan style="font-family:宋体">.3.pan style="font-family:宋体">显式编程

设计决策智能体的*直接方法是预测智能体可能所处的所有情况,然后显式地对智能体编程使其执行预先期望的动作。显式编程方法可能对简单问题很有效,但想要提供一个完整的策略,会给设计者带来很大的负担。为使对智能体编程更轻松,已有相关研究提出了各种智能体编程语言和框架。

pan style="font-family:宋体">.3.2监督学span>

在一些问题中,向智能体展示要做什么比编写一个供智能体遵循的程序更容易。设计者提供一组训练实例,自动学则从这些实例中产生。这种方法称为监督学已广泛应用于分类问题。当应用于学测到动作的映射时,这种技术有时称为行为克隆。当专家型设计者知道可适用于具有代表性的实例情境集合的动作方向时,行为克隆的效果会很好。尽管存在许多不同的学,但是通常在新的情况下它们比不上人类设计师的设计效果。

pan style="font-family:宋体">.3.3优化

另一种方法是让设计者备选决策策略空间,并且使性能量测化。评估决策策略的性能通常涉及使用决策策略行一系列仿真,然后,优化算法在该空间中执行搜索,以获得策略。如果备选策略空间是相对低维的,并且性能量测不具有多个局部解,那么各种局部或全局搜索策略都可能是合适的。虽然为了仿真通常会假设动态模型知识,但它不会用于指导搜索策略,在复杂的问题中,这是很重要的。

pan style="font-family:宋体">.3.4

规划

规划是一种优化方式,但它使用动态模型来指导搜索。规划问题的大量文献集中在确定性问题上。假设一个确定性模型允许使用一些易于扩展到高维的方法,那么对于某些问题,可以用确定性模型去估算动态特性。对于其他问题,考虑未来的不确定性则是至关重要的,因此本书专注于这些需要考虑不确定性的问题。

pan style="font-family:宋体">.3.5强化学span>

在强化学宽了模型已知这一假设。相反,智能体在与交互中学策略。设计者只需要提供一个性能量测,学就会优化智能体的行为。强化学杂性之所以有趣,是因为动作的选择不仅影响智能体是否能实现当前的目标,还会影响智能体学的能力和识别可利用的问题特征的能力。

pan style="font-family:宋体">.4结构安排

本书分理论和应用两部分。

pan style="font-family:宋体">.理论部分的安排

第2章:概率模型。概率模型讨论了如何描述不确定性,引入贝叶斯网络作为捕捉变量间概率关系的图形化模型,介绍了从上述表示行推论的算法,解释了如何学的结构和参数。

第3章:决策问题。决策问题以效用理论作为框架,用于了解不确定性条件下的决策。本章关注于单次决策、引入决策和效用节点,将决策网络作为贝叶斯网络的推广。本章还讨论了多个存在潜在竞争关系智能体的决策。

第4章:序贯问题。序贯问题讨论了当动作的输出是概率性变化时随时间变化的决策问题,引入了马尔可夫决策过程作为模拟这种问题的一种方法,展示了如何使用动态规划来计算的解决方案。由于许多问题都过于复杂难以求解,因此本章还讨论了各种不同似方法,如在线方法和直接搜索策略等。......

商品评论(0条)
暂无评论……
书友推荐
本类畅销
编辑推荐
返回顶部
中图网
在线客服