關(guān)于我們
書單推薦
新書推薦
|
基于模型的強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)基本范示,其中智能體執(zhí)行動(dòng)作以確保設(shè)備的最優(yōu)性能。雖然這種機(jī)器學(xué)習(xí)范式近年來(lái)取得了巨大的成功和普及,但以前的學(xué)術(shù)研究要么集中在理論上——最優(yōu)控制和動(dòng)態(tài)規(guī)劃——要么集中在算法上——其中大多數(shù)是基于仿真的。
《基于模型的強(qiáng)化學(xué)習(xí)》提供了一個(gè)基于模型的框架來(lái)橋接這兩個(gè)方面,從而創(chuàng)建了一個(gè)基于模型的在線學(xué)習(xí)控制主題的整體處理。在此過(guò)程中,作者尋求開發(fā)一個(gè)基于模型的數(shù)據(jù)驅(qū)動(dòng)控制框架,該框架將數(shù)據(jù)系統(tǒng)識(shí)別、基于模型的強(qiáng)化學(xué)習(xí)和最優(yōu)控制以及每個(gè)主題的應(yīng)用連接起來(lái)。這種評(píng)估經(jīng)典結(jié)果的新技術(shù)將會(huì)是更有效的強(qiáng)化學(xué)習(xí)系統(tǒng)。本書的核心是提供一個(gè)端到端的框架——從設(shè)計(jì)到應(yīng)用——一種更易于處理的基于模型的強(qiáng)化學(xué)習(xí)技術(shù)。
基于模型的強(qiáng)化學(xué)習(xí)的讀者還會(huì)發(fā)現(xiàn):
這是一本實(shí)用的教科書,適用于數(shù)據(jù)驅(qū)動(dòng)和基于學(xué)習(xí)的控制研究生課程中,強(qiáng)調(diào)從數(shù)據(jù)對(duì)動(dòng)態(tài)系統(tǒng)進(jìn)行建模和控制。
詳細(xì)比較了不同技術(shù)的影響,如基本線性二次型控制器、基于學(xué)習(xí)的模型預(yù)測(cè)控制、無(wú)模型強(qiáng)化學(xué)習(xí)和結(jié)構(gòu)化在線學(xué)習(xí)。
非完整動(dòng)力學(xué)的地面車輛應(yīng)用與實(shí)例研究,以及在四旋翼直升機(jī)上的應(yīng)用與實(shí)例研究。
一個(gè)基于Python的在線工具箱,該工具箱包含本書所涵蓋的內(nèi)容以及必要的代碼和數(shù)據(jù)。
《基于模型的強(qiáng)化學(xué)習(xí)》是高年級(jí)本科生、研究生、研究助理、教授、過(guò)程控制工程師和機(jī)器人專家的有用參考書籍。
你還可能感興趣
我要評(píng)論
|