欢迎光临中图网 请 | 注册
秋景正好,书香满堂|每满88减40
>
关于“[美]德梅萃·P.博塞克斯...”检索到   共3种现货商品
出版社:
确定 取消
售价:
折扣:
  • 阿尔法零对最优模型预测自适应控制的启示

    ¥57.3(8.3折)定价:¥69.0

    大致内容:第一章,从阿尔法零的很好性能出发,深入解读其背后着实不易的成长历程,揭示其数学模型。第二章,从确定性和随机动态规划问题入手,介绍决策问题的数学模型。第三章,从抽象视角回顾纷繁复杂的强化学习算法,揭示值函数近似与滚动改进的重要作用。第四章,从经典的线性二次型**控制问题入手,分析从阿尔法零的成功中学到的经验。第五章,分别从鲁棒、自适应、模型预测控制等问题入手,分析值函数近似与滚动改进对算法性能的提升潜力。第六章,从离散优化的视

  • 强化学习与最优控制

    ¥105.6(7.6折)定价:¥139.0

    本书的目的是考虑大型且具有挑战性的多阶段决策问题,这些问题原则上可以通过动态规划和**控制来解决,但它们的准确解决方案在计算上是难以处理的。本书讨论依赖于近似的解决方法,以产生具有足够性能的次优策略。这些方法统称为增强学习,也可以叫做近似动态规划和神经动态规划等。 本书的主题产生于**控制和人工智能思想的相互作用。本书的目的之一是探索这两个领域之间的共同边界,并架设一座具有任一领域背景的专业人士都可以访问的桥梁...

  • 动态规划与最优控制——近似动态规划(第I卷)

    ¥75.2(7.6折)定价:¥99.0

    本书系统性介绍动态规划与**控制,包括动态规划算法、确定性系统与随机最短路问题、确定性连续时间**控制、状态信息完整的问题、状态信息缺失的问题、次优与适应控制、无穷阶段问题等...

编辑推荐

中图网
返回顶部