欢迎光临中图网 请 | 注册
每满100减50,满108送2025台历
>
关于“(美)德梅萃·P.博赛卡斯”检索到   共3种现货商品
  • 靠前知名大学原版教材——信息技术学科与电气工程学科系列强化学习与最优控制

    ¥93.9(6.3折)定价:¥149.0

    本书的目的是考虑大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和很优控制来解决,但它们的准确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法,以产生具有足够性能的次优策略。这些方法统称为增强学习,也可以叫做近似动态规划和神经动态规划等。 本书的主题产生于很优控制和人工智能思想的相互作用。本书的目的之一是探索这两个领域之间的共同边界,并架设一座具有任一领域背景的专业人士都可以访问的桥梁...

  • 抽象动态规划(第2版)

    ¥53.4(6折)定价:¥89.0

    第2版的主要目的是扩大第1版(2013)的第3章和第4章的半契约模型的内容,并以自第1版以来作者在期刊和报告中发表的研究成果作为补充。这本书的数学内容很好优雅且严格,依靠抽象的力量专注于基础知识。该书抢先发售提供了该领域的全面综合知识,同时提出了许多新研究,其中一些研究与当前很好活跃的领域(如近似动态编程)有关。本书中散布着许多例子,用严谨的理论统一起来,并将其应用于特定类型的问题,例如折扣、随机最短路径、半马尔可夫、最小极大、序贯博

  • 策略前展、策略迭代与分布式强化学习

    ¥116.8(8.4折)定价:¥139.0

    本书主要内容:第1章为动态规划原理;第2章为策略前展与策略改进;第3章为专用策略前展算法;第4章为值和策略的学习;第5章为无限时间分布式和多智能体算法。 横空出世的围棋软件AlphaZero算法对本书有很大影响。本书内容同样基于策略迭代、值网络和策略网络的神经网络近似表示、并行与分布式计算和前瞻最小化约简技术的核心框架构建,并对算法的适用范围做了拓展。本书的特色在于给出了分布式计算和多智能体系统框架下的强化学习策略改进计算的效

编辑推荐

中图网
返回顶部