關(guān)于我們
書單推薦
新書推薦
|
Joy RL 讀者對(duì)象:機(jī)器學(xué)習(xí)人員
本書是《EasyRL:強(qiáng)化學(xué)習(xí)教程》的配套實(shí)踐教程。本書將在第一版的基礎(chǔ)上以更加嚴(yán)謹(jǐn)?shù)娘L(fēng)格深入淺出地介紹馬爾可夫決策過程、蒙特卡羅方法、時(shí)序差分方法、Sarsa、Q-learning等傳統(tǒng)強(qiáng)化學(xué)習(xí)算法,以及策略梯度、近端策略優(yōu)化、深度Q網(wǎng)絡(luò)、深度確定性策略梯度等常見深度強(qiáng)化學(xué)習(xí)算法的基本概念和方法,并以大量生動(dòng)有趣的例子幫助讀者理解強(qiáng)化學(xué)習(xí)問題的建模過程以及核心算法的細(xì)節(jié)。同時(shí),增加最大熵學(xué)習(xí)、多智能體學(xué)習(xí)、離線強(qiáng)化學(xué)習(xí)等內(nèi)容,極大豐富強(qiáng)化學(xué)習(xí)的入門內(nèi)容。
你還可能感興趣
我要評(píng)論
|