中图网

>

软件工程/开发项目管理

Python深度强化学习入门:强化学习和深度学习的搜索与控制

包邮 Python深度强化学习入门:强化学习和深度学习的搜索与控制

作者：伊藤多一等

出版社：机械工业出版社出版时间：2022-04-01

开本： 16开 页数： 240

本类榜单：计算机/网络销量榜

中图价:¥61.5(6.9折) 定价 ~~¥89.0~~ 登录后可看到会员价

加入购物车收藏

开年大促， 全场包邮

?新疆、西藏除外

本类五星书更多>

>
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用

全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用

¥14.4¥45
>
决战行测5000题(言语理解与表达)

决战行测5000题(言语理解与表达)

¥44.1¥88
>
软件性能测试.分析与调优实践之路

软件性能测试.分析与调优实践之路

¥56.2¥69
>
第一行代码Android

第一行代码Android

¥55.4¥99
>
JAVA持续交付

JAVA持续交付

¥58.1¥119
>
EXCEL最强教科书(完全版)(全彩印刷)

EXCEL最强教科书(完全版)(全彩印刷)

¥31.1¥69.9
>
深度学习

深度学习

¥92.4¥168

商品详情
商品评论(0条)

中图价:¥61.5 加入购物车

版权信息
本书特色
内容简介
目录
作者简介

Python深度强化学习入门:强化学习和深度学习的搜索与控制版权信息

ISBN：9787111700722
条形码：9787111700722 ; 978-7-111-70072-2
装帧：一般胶版纸
册数：暂无
重量：暂无
所属分类：
计算机/网络
>
软件工程/开发项目管理

Python深度强化学习入门:强化学习和深度学习的搜索与控制本书特色

适读人群：人工智能、机器学习、深度学习相关专业领域的技术人员和爱好者《Python深度强化学习入门：强化学习和深度学习的搜索与控制》特点：以上手实操介绍为主，可操作性强从基础开始介绍深度强化学习的概念及算法通过多个典型的实际问题，剖析深度强化学习的具体实现方法

Python深度强化学习入门:强化学习和深度学习的搜索与控制内容简介

《Python深度强化学习入门：强化学习和深度学习的搜索与控制》共7章。其中，第1章介绍了机器学习的分类、强化学习的学习机制以及深度强化学习的概念；第2章通过强化学习的基本概念、马尔科夫决策过程和贝尔曼方程、贝尔曼方程的求解方法、无模型控制等介绍了强化学习的基本算法；第3章通过深度学习、卷积神经网络（CNN）、循环神经网络（RNN）介绍了强化学习中深度学习的特征提取方法；第4章通过行动价值函数的网络表示、策略函数的网络表示介绍了深度强化学习的实现；第5章通过策略梯度法的连续控制、学习算法和策略模型等，详细介绍了深度强化学习在连续控制问题中的应用及具体实现；第6章通过巡回推销员问题和魔方问题详细介绍了深度强化学习在组合优化中的应用及具体实现；第7章通过SeqGAN的文本生成和神经网络的架构搜索详细介绍了深度强化学习在时间序列数据生成的应用。在附录中还给出了Colaboratory和Docker等深度强化学习开发环境的构建。

Python深度强化学习入门:强化学习和深度学习的搜索与控制目录

目录译者序原书前言阅读本书需要的知识基础本书的结构本书示例的运行环境 1.1 机器学习的分类004 1.1.1 监督学习005 1.1.2 无监督学习006 1.1.3 强化学习007 1.2 强化学习的学习机制008 1.3 深度强化学习011 2.1 强化学习的基本概念014 2.1.1 强化学习的问题设定014 2.1.2 强化学习的机制014 2.1.3 关于本章的内容016 2.2 马尔可夫决策过程和贝尔曼方程017 2.2.1 马尔可夫决策过程017 2.2.2 贝尔曼方程020 2.3 贝尔曼方程的求解方法024 2.3.1 动态规划法024 2.3.2 蒙特卡洛法031 2.3.3 TD学习法033 2.4 无模型控制037 2.4.1 策略改进的方法037 2.4.2 基于价值的方法038 2.4.3 基于策略的方法043 2.4.4 Actor-Critic法049 3.1 深度学习056 3.1.1 深度学习的出现和背景056 3.1.2 什么是深度学习？056 3.1.3 深度学习平台062 3.2 CNN067 3.2.1 什么是CNN067 3.2.2 CNN的应用071 3.3 RNN074 3.3.1 什么是RNN074 3.3.2 什么是LSTM079 3.3.3 RNN的应用081 4.1 深度强化学习的发展086 4.1.1 DQN的出现086 4.1.2 用于强化学习的模拟器086 4.2 行动价值函数的网络表示089 4.2.1 DQN算法089 4.2.2 DQN算法的实现092 4.2.3 学习结果099 4.3 策略函数的网络表示101 4.3.1 Actor的实现101 4.3.2 Critic的实现101 4.3.3 示例代码的介绍102 4.3.4 学习结果108 5.1 策略梯度法的连续控制114 5.1.1 连续控制114 5.1.2 策略梯度法学习114 5.2 学习算法和策略模型117 5.2.1 算法概况117 5.2.2 REINFORCE算法118 5.2.3 基准函数的引入118 5.2.4 高斯模型的策略概率119 5.3 连续行动模拟器121 5.3.1 pybullet-gym121 5.3.2 Walker2D122 5.4 算法的实现126 5.4.1 算法实现的总体构成126 5.4.2 train.py127 5.4.3 policy_estimator.py129 5.4.4 value_estimator.py132 5.5 学习结果及预测控制134 5.5.1 学习结果134 5.5.2 预测控制的结果136 5.5.3 其他环境模型的应用137 5.5.4 总结140 6.1 组合优化中的应用144 6.1.1 关于组合优化144 6.2 巡回推销员问题145 6.2.1 通过强化学习解决巡回推销员问题145 6.2.2 实现概要147 6.2.3 运行结果155 6.2.4 今后的发展趋势157 6.3 魔方问题158 6.3.1 用强化学习解决魔方问题158 6.3.2 实现概要161 6.3.3 实现结果171 6.3.4 AC+MCTS算法的预测结果173 6.3.5 今后的发展趋势177 6.4 总结179 7.1 根据SeqGAN的文本生成182 7.1.1 GAN182 7.1.2 SeqGAN183 7.1.3 输入数据185 7.1.4 使用的算法及其实现187 7.1.5 实现结果195 7.1.6 总结198 7.2 神经网络架构的搜索198 7.2.1 神经体系结构搜索198 7.2.2 语义分割199 7.2.3 U-Net200 7.2.4 文件目录结构201 7.2.5 输入数据201 7.2.6 所使用的算法204 7.2.7 实现结果213 7.2.8 总结215 附录A Colaboratory的GPU环境构建218 A.1 Colaboratory218 A.2 Colaboratory的使用方法218 附录B 通过Docker进行Windows环境的构建222 B.1 介绍222 B.2 Docker的安装222 B.3 Docker映像的创建228 B.4 容器的启动232 B.5 运行情况的查看234 参考文献238

展开全部

Python深度强化学习入门:强化学习和深度学习的搜索与控制作者简介

　　[日]伊藤多一，1995年在名古屋大学理学研究所完成博士课程，井获得博士学位。后一直从事粒子物理学研究，直到2004年3月。同年，加入了一家专门从事合同数据分析的风险公司，井参与了多个数据分析项目。自2013年以来，他一直在BrainPad公司从事机器学习的广告效果分析工作。自2016年以来，通过深度学习参与了图像分析项目。今津义充，博士学位（理学），熟悉统计分析、模型构建以及基于数值分析的基本粒子和核物理研究。自2013年以来，领导了BrainPad公司的定量分析项目，例如需求预测和数学优化等。近年来，一直从事利用深度学习技术的项目分析和应用研究。须藤广大，在奈良科学技术学院主修自然语言处理，获得硕士学位（信息工程）。后以新毕业生的身份加入BrainPad公司，井以机器学习工程师的身份从事与深度学习相关的项目分析和开发。仁平将人，硕士学位，在研究生院主修管理系统工程专业，于2018年加入BrainPad公司成为数据科学家。加入公司后，从事有关强化学习和自然语言处理的项目。川崎悠介，硕士学位，大学期间主修信息工程，并于2018年加入BrainPad公司。从事图像识别和时间序列预测的相关项目研究。

商品评论(0条)

写书评赚书币

暂无评论……

书友推荐

>
我与地坛
我与地坛
史铁生
¥16.4~~¥28.0~~
>
姑妈的宝刀
姑妈的宝刀
莫言
¥15.7~~¥30.0~~
>
人文阅读与收藏·良友文学丛书:一天的工作
人文阅读与收藏·良友文学丛书:一天的工作
鲁迅
¥15.7~~¥45.8~~
>
自卑与超越
自卑与超越
[奥]阿尔弗雷德·阿德勒著，韩阳译
¥13.7~~¥39.8~~
>
伊索寓言-世界文学名著典藏-全译本
伊索寓言-世界文学名著典藏-全译本
[古希腊] 伊索著，陈韵如译
¥6.7~~¥19.0~~
>
莉莉和章鱼
莉莉和章鱼
[美]史蒂文·罗利著，祝文亭译
¥14.4~~¥42.0~~
>
史学评论
史学评论
杨玉圣
¥14.4~~¥42.0~~
>
经典常谈
经典常谈
朱自清
¥16.7~~¥39.8~~

本类畅销

系统架构设计方法-使用5BC架构描述语言

邱国鹏

¥13.1~~¥45~~
Java面向对象程序设计

谢振华,李向东,洪晓彬

¥27.1~~¥45~~
Paracraft编程入门:成为3D动画与编程能手

李西峙，李铁才著

¥73.9~~¥96~~
系统架构设计-程序员向架构师转型之路

郑天民

¥31.9~~¥49.8~~
软件质量管理实践

刘文红，侯育卓，郭栋，张卫祥，杨隽，沈玥

¥48.3~~¥69~~
Python金融量化分析

肖建军，高拴平编著

¥59.3~~¥79.8~~

浏览历史

陪你到时光深处/吉诺作品
吉诺
¥19.3~~¥42.8~~
光学测试技术
张旭升[等]编著
¥37.5~~¥58.0~~
实用文体写作(第二版)
傅克斌
¥11.9~~¥35.0~~
地理标志农产品质量安全协同治理机制研究
陈彦丽，赵慧
¥48.5~~¥66.0~~
35公斤的希望
（法）嘉瓦尔达　著，王恬　译
¥8.8~~¥13.5~~

包邮 Python深度强化学习入门:强化学习和深度学习的搜索与控制

Python深度强化学习入门:强化学习和深度学习的搜索与控制版权信息

Python深度强化学习入门:强化学习和深度学习的搜索与控制本书特色

Python深度强化学习入门:强化学习和深度学习的搜索与控制内容简介

Python深度强化学习入门:强化学习和深度学习的搜索与控制目录

Python深度强化学习入门:强化学习和深度学习的搜索与控制作者简介

我与地坛

姑妈的宝刀

人文阅读与收藏·良友文学丛书:一天的工作

自卑与超越

伊索寓言-世界文学名著典藏-全译本

莉莉和章鱼

史学评论

经典常谈

系统架构设计方法-使用5BC架构描述语言

Java面向对象程序设计

Paracraft编程入门:成为3D动画与编程能手

系统架构设计-程序员向架构师转型之路

软件质量管理实践

Python金融量化分析

陪你到时光深处/吉诺作品

光学测试技术

实用文体写作(第二版)

地理标志农产品质量安全协同治理机制研究

35公斤的希望

人间草木

朱仙镇年画:七日谈

时间停止的那一天

俄罗斯书简

“水浒”识小录

女孩们

包邮 Python深度强化学习入门:强化学习和深度学习的搜索与控制

Python深度强化学习入门:强化学习和深度学习的搜索与控制 版权信息

Python深度强化学习入门:强化学习和深度学习的搜索与控制 本书特色

Python深度强化学习入门:强化学习和深度学习的搜索与控制 内容简介

Python深度强化学习入门:强化学习和深度学习的搜索与控制 目录

Python深度强化学习入门:强化学习和深度学习的搜索与控制 作者简介

Python深度强化学习入门:强化学习和深度学习的搜索与控制版权信息

Python深度强化学习入门:强化学习和深度学习的搜索与控制本书特色

Python深度强化学习入门:强化学习和深度学习的搜索与控制内容简介

Python深度强化学习入门:强化学习和深度学习的搜索与控制目录

Python深度强化学习入门:强化学习和深度学习的搜索与控制作者简介