關(guān)于我們
書單推薦
新書推薦
|
強(qiáng)化學(xué)習(xí) 讀者對(duì)象:機(jī)器學(xué)習(xí)研究人員
本書的主要內(nèi)容有:學(xué)習(xí)強(qiáng)化學(xué)習(xí)是什么,以及算法如何解決具體問題。掌握強(qiáng)化學(xué)習(xí)的基礎(chǔ)知識(shí),包括馬爾可夫決策過程、動(dòng)態(tài)規(guī)劃和時(shí)間差分算法。深入研究系列基于值函數(shù)和政策梯度的算法。應(yīng)用先進(jìn)的強(qiáng)化學(xué)習(xí)解決方案,如元學(xué)習(xí)、分層學(xué)習(xí)、多智能體、模仿學(xué)習(xí)等。了解最前沿的深度強(qiáng)化學(xué)習(xí)算法,包括Rainbow、PPO、TD3、SAC等。
你還可能感興趣
我要評(píng)論
|