欧美亚洲精品二区久久久,96热国产在线观看

本書理論完備，涵蓋主流非深度強化學習算法和深度強化學習算法；實戰(zhàn)性強，基于Python、Gym、TensorFlow 2等構(gòu)建，并有AlphaZero等綜合案例。全書共12章，主要內(nèi)容如下。

第1章：介紹強化學習的基礎知識與強化學習環(huán)境庫Gym的使用，并給出完整的編程實例。

第2～9章：介紹強化學習的理論知識。以Markov決策過程為基礎模型，覆蓋了所有主流強化學習理論和算法，包括資格跡等經(jīng)典算法和深度確定性梯度策略等深度強化學習算法。所有章節(jié)都提供了與算法配套的Python程序，使讀者完全掌握強化學習算法的原理與應用。

第10～12章：介紹了多個熱門綜合案例，包括電動游戲、棋盤游戲和自動駕駛。算法部分涵蓋了在《自然》《科學》等權(quán)威期刊上發(fā)表的多個深度強化學習明星算法，包括AlphaGo的*改進版AlphaZero。

強化學習正在改變?nèi)祟惿鐣姆椒矫婷妫夯趶娀瘜W習的游戲AI已經(jīng)在圍棋、星際爭霸等游戲上戰(zhàn)勝人類頂尖選手，基于強化學習的控制算法已經(jīng)運用于機器人、無人機等設備，基于強化學習的交易算法已經(jīng)部署在金融平臺上并取得超額收益。由于同一套強化學習代碼在使用同一套參數(shù)的情況下能解決多個看起來毫無關(guān)聯(lián)的問題，所以強化學習常被認為是邁向通用人工智能的重要途徑。在此誠邀相關(guān)專業(yè)人士研究強化學習，以立于人工智能的時代之巔。
內(nèi)容梗概
本書介紹強化學習理論及其Python實現(xiàn)，全書分為三個部分。
第1章：介紹強化學習的基礎知識與環(huán)境庫Gym的使用，并給出一個完整的編程實例。
第2～9章：介紹強化學習的理論和算法。采用嚴謹?shù)臄?shù)學語言，推導強化學習的基本理論，進而在理論的基礎上講解算法，并為算法提供配套的Python實現(xiàn)。算法的講解和Python實現(xiàn)逐一對應，覆蓋了所有主流的強化學習算法。
第10～12章：介紹多個綜合案例，包括電動游戲、棋盤游戲和自動駕駛。環(huán)境部分涵蓋Gym庫的完整安裝和自定義擴展，也包括Gym庫以外的環(huán)境。算法部分涵蓋了《自然》《科學》等權(quán)威期刊發(fā)表的多個深度強化學習明星算法。
本書特色
本書完整地介紹了主流的強化學習理論。
全書采用完整的數(shù)學體系，各章內(nèi)容循序漸進，嚴謹?shù)刂v授強化學習的理論基礎，主要定理均給出證明過程。基于理論講解強化學習算法，覆蓋了所有主流強化學習算法，包括資格跡等經(jīng)典算法和深度確定性梯度策略等深度強化學習算法。
全書采用一致的數(shù)學符號，并且與權(quán)威強化學習教程（如R. Sutton等的《Reinforce-ment Learning: An Introduction（第2版）》和D. Silver的視頻課程）完美兼容。
本書各章均提供Python代碼，實戰(zhàn)性強。
全書代碼統(tǒng)一規(guī)范，基于最新的Python 3.7（兼容Python 3.6）、Gym 0.12和TensorFlow 2（兼容TensorFlow 1）實現(xiàn)強化學習算法。所有代碼在Windows、macOS和Linux三大操作系統(tǒng)上均可運行，書中給出了環(huán)境的安裝和配置方法。
涉及環(huán)境全面。第1～9章提供算法的配套實現(xiàn)，強化學習環(huán)境只依賴于Gym的最小安裝，使理論學習免受環(huán)境安裝困擾；第10～12章的綜合案例既涵蓋Gym庫的完整安裝和自定義擴展，還包括Gym庫以外的環(huán)境，讓讀者體驗更加復雜的強化學習任務。
全書實現(xiàn)對硬件配置要求低。第1～9章代碼在沒有GPU的計算機上也可運行；第10～12章代碼在配置普通GPU的計算機上即可運行。
代碼下載和技術(shù)支持
本書代碼下載地址為：http://github.com/zhiqingxiao/rl-book。筆者會不定期更新代碼，以適應軟件版本的升級。
在此推薦你加入本書學習交流QQ群：935702193。如果有任何意見、建議或經(jīng)過網(wǎng)絡搜索仍不能解決的問題，可以在QQ群里提問。筆者的郵箱是：xzq.xiaozhiqing@gmail.com。
致謝
在此感謝為本書出版做出貢獻的所有工作人員。其中，機械工業(yè)出版社的高婧雅女士是本書的責任編輯，她對本書的寫作提出了很多建設性意見。同時，還要感謝機械工業(yè)出版社的其他編輯為提升本書質(zhì)量所做的大量工作，與他們合作是一個愉快的過程。我要特別感謝我的父親肖林進和母親許麗平，他們也參與了本書的編寫。同時，還要感謝我的上級、同事和其他親友，他們在本書寫作期間給予我極大的支持。
感謝你選擇本書。祝你學習快樂！

你還可能感興趣

我要評論