超级碰视频免费观看,黄片无遮挡无码一站

《Python深度強化學習入門：強化學習和深度學習的搜索與控制》共7章。其中，第1章介紹了機器學習的分類、強化學習的學習機制以及深度強化學習的概念；第2章通過強化學習的基本概念、馬爾科夫決策過程和貝爾曼方程、貝爾曼方程的求解方法、無模型控制等介紹了強化學習的基本算法；第3章通過深度學習、卷積神經(jīng)網(wǎng)絡（CNN）、循環(huán)神經(jīng)網(wǎng)絡（RNN）介紹了強化學習中深度學習的特征提取方法；第4章通過行動價值函數(shù)的網(wǎng)絡表示、策略函數(shù)的網(wǎng)絡表示介紹了深度強化學習的實現(xiàn)；第5章通過策略梯度法的連續(xù)控制、學習算法和策略模型等，詳細介紹了深度強化學習在連續(xù)控制問題中的應用及具體實現(xiàn)；第6章通過巡回推銷員問題和魔方問題詳細介紹了深度強化學習在組合優(yōu)化中的應用及具體實現(xiàn)；第7章通過SeqGAN的文本生成和神經(jīng)網(wǎng)絡的架構(gòu)搜索詳細介紹了深度強化學習在時間序列數(shù)據(jù)生成的應用。在附錄中還給出了Colaboratory和Docker等深度強化學習開發(fā)環(huán)境的構(gòu)建。

你還可能感興趣

我要評論