中图网检索: (美)德梅萃·P.博赛卡斯

图书分类

中图网

关于“(美)德梅萃·P.博赛卡斯”检索到共3种现货商品

分类：

展开

出版社：

清华大学出版社(3)

所有出版社 Q

确定取消

清华大学出版社(3)
清华大学出版社(3)

清华大学出版社(3)
清华大学出版社(3)

展开

售价：

￥

---

￥

确定

折扣：

---

确定

搜索

搜索全部

搜索全部
书名
作者
出版社
ISBN

靠前知名大学原版教材——信息技术学科与电气工程学科系列强化学习与最优控制

[美]德梅萃·P.博赛卡斯( / 2020-06-01 / 清华大学出版社

¥93.9(6.3折)定价:~~¥149.0~~

本书的目的是考虑大型且具有挑战性的多阶段决策问题，这些问题原则上可以通过动态规划和很优控制来解决，但它们的准确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法，以产生具有足够性能的次优策略。这些方法统称为增强学习，也可以叫做近似动态规划和神经动态规划等。本书的主题产生于很优控制和人工智能思想的相互作用。本书的目的之一是探索这两个领域之间的共同边界，并架设一座具有任一领域背景的专业人士都可以访问的桥梁...

加入购物车收藏
抽象动态规划(第2版)

[美]德梅萃·P.博赛卡斯（Dimitr / 2022-04-01 / 清华大学出版社

¥53.4(6折)定价:~~¥89.0~~

第2版的主要目的是扩大第1版（2013）的第3章和第4章的半契约模型的内容，并以自第1版以来作者在期刊和报告中发表的研究成果作为补充。这本书的数学内容很好优雅且严格，依靠抽象的力量专注于基础知识。该书抢先发售提供了该领域的全面综合知识，同时提出了许多新研究，其中一些研究与当前很好活跃的领域（如近似动态编程）有关。本书中散布着许多例子，用严谨的理论统一起来，并将其应用于特定类型的问题，例如折扣、随机最短路径、半马尔可夫、最小极大、序贯博

加入购物车收藏
策略前展、策略迭代与分布式强化学习

(美)德梅萃·P.博赛卡斯 / 2022-04-01 / 清华大学出版社

¥116.8(8.4折)定价:~~¥139.0~~

本书主要内容：第1章为动态规划原理；第2章为策略前展与策略改进；第3章为专用策略前展算法；第4章为值和策略的学习；第5章为无限时间分布式和多智能体算法。横空出世的围棋软件AlphaZero算法对本书有很大影响。本书内容同样基于策略迭代、值网络和策略网络的神经网络近似表示、并行与分布式计算和前瞻最小化约简技术的核心框架构建，并对算法的适用范围做了拓展。本书的特色在于给出了分布式计算和多智能体系统框架下的强化学习策略改进计算的效

加入购物车收藏

五星书

中图网帆布包--读立青年（深红）

中图网

¥48.0~~¥88.0~~
姑妈的宝刀

莫言

¥13.5~~¥30.0~~
文创幸存品-2023读者节金属书签

中图网

¥20.0~~¥45.0~~
文创幸存品-2023读者节纪念徽章-一星会员专属-纸涧

中图网

¥20.0~~¥45.0~~
中图网文创--“无事”大号帆布包(墨绿)

中图网

¥44.0~~¥88.0~~

编辑推荐

上海滩的贾斯汀·比伯

老王子

￥13.3~~￥39~~

加入购物车
俄罗斯书简

泰戈尔

￥10.1~~￥22~~

加入购物车
陶潜和樱子

刘争争

￥12.9~~￥38~~

加入购物车
熊千佳昆虫记

[日]熊田千佳慕著,张勇译

￥27.1~~￥48~~

加入购物车
时间停止的那一天

[英]蕾秋·乔伊斯著,焦晓菊译

￥21.8~~￥42.8~~

加入购物车
百年梦忆:梁实秋人生自述

梁实秋

￥8.4~~￥28~~

加入购物车

图书分类

其他

年龄馆

更多

更多

更多

新上架特价书

五星书

编辑推荐