强化学习：原理与Python实战最新章节全文无弹窗在线阅读-QQ阅读短篇女生网

本书从原理和实战两个方面介绍了强化学习。原理方面，深入介绍了主流强化学习理论和算法，覆盖资格迹等经典算法和MuZero等深度强化学习算法；实战方面，每章都配套了编程案例，以方便读者学习。全书从逻辑上分为三部分。第1章：从零开始介绍强化学习的背景知识，介绍环境库Gym的使用。第2～15章：基于折扣奖励离散时间Markov决策过程模型，介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论，进而在理论的基础上讲解算法，并为算法提供配套代码实现。基础理论的讲解突出主干部分，算法讲解全面覆盖主流的强化学习算法，包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应，还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章：介绍其他强化学习模型，包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等，以便更好了解强化学习研究的全貌。

品牌：机械工业出版社

上架时间：2023-08-01 00:00:00

出版社：机械工业出版社

本书数字版权由机械工业出版社提供，并由其授权上海阅文信息技术有限公司制作发行

加书架

下载

听书

强化学习：原理与Python实战最新章节

会员
强化学习：原理与Python实现
全书分为三个部分。第一部分了解强化学习应用，了解强化学习基本知识，搭建强化学习测试环境。该部分包括：强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分：Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论；深度强化学习算法部分：详细剖析全部具有重要影响力的深度强
肖智清程序设计12.2万字

强化学习：原理与Python实战

强化学习：原理与Python实战最新章节

强化学习：原理与Python实现

PyTorch深度学习应用实战

AIGC：让生成式AI成为自己的外脑

工业人工智能

突破边界：AI大模型驱动数智化能力变革

ChatGPT原理与应用开发

知识图谱从0到1：原理与Python实战

大语言模型：原理、应用与优化

自适应和反应式机器人控制：动态系统法

智能计算系统：从深度学习到大模型

量子人工智能

大型语言模型实战指南：应用实践与场景落地

玩赚ChatGPT：人人都能用的工作好帮手

破解深度学习（基础篇）：模型算法与实现

解构ChatGPT

空间计算：人工智能驱动的新商业革命

空间智能原理与应用

机器学习（第2版）

大模型实战：微调、优化与私有化部署

基于信息增强的图神经网络学习方法研究