欢迎光临中图网 请 | 注册
> >
多机器人系统强化学习

多机器人系统强化学习

出版社:北京邮电大学出版社出版时间:2024-01-01
开本: 26cm 页数: 272页
本类榜单:教材销量榜
中 图 价:¥55.1(8.1折) 定价  ¥68.0 登录后可看到会员价
加入购物车 收藏
运费6元,满39元免运费
?新疆、西藏除外
本类五星书更多>

多机器人系统强化学习 版权信息

  • ISBN:9787563570607
  • 条形码:9787563570607 ; 978-7-5635-7060-7
  • 装帧:平装-胶订
  • 册数:暂无
  • 重量:暂无
  • 所属分类:>

多机器人系统强化学习 内容简介

本书以强化学习算法与多机器人系统的结合为主要背景,介绍了主要的强化学习算法模型,讨论了它们的原理和优缺点;本书针对多机器人协作,从实际应用问题的角度分析,指出了局部性、不确定性和自组织网络等在学习中的现实意义;本书针对强化学习存在的学习速度慢、计算复杂度高等问题,研究了几种改进算法,并基于MATLAB设计了机器人仿真工具箱,以机器人路径规划与覆盖问题为背景进行了仿真研究。

多机器人系统强化学习 目录

第1章 绪论 1.1 研究背景与意义 1.2 机器学习算法 1.3 多机器人的协调与协作 1.4 不确定环境下的多机器人系统 本章参考文献 第2章 多机器人协作与强化学习模型 2.1 引言 2.2 强化学习原理 2.2.1 强化学习结构 2.2.2 Monte Carlo算法 2.2.3 瞬时差分法 2.2.4 Q-学习 2.2.5 Sarsa算法 2.2.6 Actor-Critic学习算法 2.2.7 R-学习算法 2.3 分布式强化学习模型 2.3.1 分布式强化学习模型 2.3.2 研究现况及存在的问题 2.4 多机器人决策模型 2.4.1 马尔可夫模型 2.4.2 分布式马尔可夫模型 2.4.3 局部可观测的马尔可夫模型 2.4.4 分布式局部可观测的马尔可夫模型 2.4.5 研究现状与存在的问题 2.5 多机器人一致性模型 2.5.1 图论 2.5.2 矩阵论 2.5.3 Gossip一致性算法 2.5.4 离散一致性算法 2.6 强化学习存在问题及改进分析 2.6.1 盲目搜索方式与启发式搜索方式分析 2.6.2 启发式强化学习分析 2.6.3 迁移强化学习分析 2.6.4 事件驱动与机器学习的结合问题分析 2.7 本章小结 本章参考文献 第3章 基于一致性的多机器人强化学习研究 3.1 引言 3.2 基于一致性的DEC-POMDP强化学习框架 3.2.1 强化学习中的局部观测性和不确定性 3.2.2 分布式多机器人强化学习模型 3.2.3 多机器人强化学习一致性设计方案 3.3 基于一致性的多机器人强化学习算法 3.3.1 基于一致性的多机器人强化学习算法 3.3.2 基于一致性的策略化简 3.4 收敛性分析 3.5 仿真实验 3.6 本章小结 本章参考文献
展开全部

多机器人系统强化学习 作者简介

张文旭,兰州理工大学,副教授,硕导。发表学术论文20余篇,其中EI收录13篇、SCI收录4篇(第一作者或通讯作者4篇);主持或参与国家自然基金项目5项,甘肃省自然基金项目4项,主持企业委托项目2项;获授权国家发明专利2项、实用新型专利3项、软件著作权4项。

商品评论(0条)
暂无评论……
书友推荐
本类畅销
编辑推荐
返回顶部
中图网
在线客服