關(guān)于我們
書(shū)單推薦
新書(shū)推薦

基于Python的強(qiáng)化學(xué)習(xí)

基于Python的強(qiáng)化學(xué)習(xí)

定  價(jià):88 元

        

  • 作者:[美]安德里亞·隆薩(AndreaLonza)劉繼紅王瑞文譯
  • 出版時(shí)間:2022/12/1
  • ISBN:9787519870379
  • 出 版 社:中國(guó)電力出版社
  • 中圖法分類:TP311.561 
  • 頁(yè)碼:
  • 紙張:膠版紙
  • 版次:
  • 開(kāi)本:16開(kāi)
9
7
8
8
7
7
0
5
3
1
7
9
9

本書(shū)首先介紹在強(qiáng)化學(xué)習(xí)環(huán)境中工作所需的工具、庫(kù)和設(shè)置,涵蓋了強(qiáng)化學(xué)習(xí)的構(gòu)成模塊,深入探討基于值的方法,如Q-learning和SARSA算法的應(yīng)用。讀者將學(xué)習(xí)如何結(jié)合使用Q-learning和神經(jīng)網(wǎng)絡(luò)來(lái)解決復(fù)雜問(wèn)題。此外,在學(xué)習(xí)*d*dPG和TD3確定性算法之前,讀者將學(xué)習(xí)策略梯度方法,如TRPO和PPO,以提高性能和穩(wěn)定性。本書(shū)還介紹模仿學(xué)習(xí)的原理,以及Dagger如何教智能體飛行。讀者將探索進(jìn)化策略和黑盒優(yōu)化技術(shù)。最后,讀者將掌握探索方法,如UCB和UCB1,并開(kāi)發(fā)一個(gè)名為ESBAS的元算法。

 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容