91免费观看国产免费,久久精品国产亚洲av水果派

Joy RL

定　　價(jià)：59.8 元

作者：江季，王琦，楊毅遠(yuǎn)著
出版時(shí)間：2023/12/1
ISBN：9787115631541
出版社：人民郵電出版社

中圖法分類：TP181
頁碼：222頁
紙張：
版次：1
開本：26cm

內(nèi)容簡(jiǎn)介

本書是《EasyRL：強(qiáng)化學(xué)習(xí)教程》的配套實(shí)踐教程。本書將在第一版的基礎(chǔ)上以更加嚴(yán)謹(jǐn)?shù)娘L(fēng)格深入淺出地介紹馬爾可夫決策過程、蒙特卡羅方法、時(shí)序差分方法、Sarsa、Q-learning等傳統(tǒng)強(qiáng)化學(xué)習(xí)算法，以及策略梯度、近端策略優(yōu)化、深度Q網(wǎng)絡(luò)、深度確定性策略梯度等常見深度強(qiáng)化學(xué)習(xí)算法的基本概念和方法，并以大量生動(dòng)有趣的例子幫助讀者理解強(qiáng)化學(xué)習(xí)問題的建模過程以及核心算法的細(xì)節(jié)。同時(shí)，增加最大熵學(xué)習(xí)、多智能體學(xué)習(xí)、離線強(qiáng)化學(xué)習(xí)等內(nèi)容，極大豐富強(qiáng)化學(xué)習(xí)的入門內(nèi)容。

你還可能感興趣

我要評(píng)論