GOG0全球大胆高清视频,久久精品免费视频播放,欧美成人精品a片免费一区99

本書共4章。第1章介紹了人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)、強化學(xué)習(xí)的基本概念。第2章以Q學(xué)習(xí)為例，重點介紹了強化學(xué)習(xí)的原理、算法步驟、代碼實現(xiàn)、代碼運行調(diào)試。第3章先對深度學(xué)習(xí)的幾種常見的類型和原理進行介紹，然后給出了例程和調(diào)試方法。第4章以Q學(xué)習(xí)中運用神經(jīng)網(wǎng)絡(luò)為例，介紹了深度強化學(xué)習(xí)的基本原理和方法，同時也給出了例程和調(diào)試方法。

原書前言近年來，被稱為“深度學(xué)習(xí)”的機器學(xué)習(xí)方法在諸多領(lǐng)域取得了成功。深度學(xué)習(xí)誕生之初，在圖像處理領(lǐng)域中為圖像識別率取得歷史性突破做出了非常大的貢獻。隨后，隨著深度學(xué)習(xí)的不斷發(fā)展，深度學(xué)習(xí)不局限于應(yīng)用在圖像處理領(lǐng)域，在各種各樣的機器學(xué)習(xí)應(yīng)用領(lǐng) 域都取得了非常顯著的成果。在深度學(xué)習(xí)的成功案例中，有一個基于強化學(xué)習(xí)的深度學(xué)習(xí)技術(shù)應(yīng)用方向。強化學(xué)習(xí)是單純從一系列行動的結(jié)果進行行動知識學(xué)習(xí)的方法。在強化學(xué)習(xí)中引入深度學(xué)習(xí)的方法，一般我們稱為深度強化學(xué)習(xí)。關(guān)于深度強化學(xué)習(xí)成功案例的應(yīng)用報道非常多，例如，通過運用深度強化學(xué)習(xí)，計算機能夠在汽車轉(zhuǎn)向盤操控方面獲得超越人類的技能;通過運用深度強化學(xué)習(xí)，可以制造出能夠打敗圍棋世界冠軍的AI圍棋棋手等。本書首先對強化學(xué)習(xí)和深度學(xué)習(xí)的基礎(chǔ)知識進行介紹，然后在此基礎(chǔ)上，再對深度強化學(xué)習(xí)的原理和機制進行具體說明。同時，本書不僅僅是在概念上的說明，而是對具體算法用 C語言進行了編碼和實現(xiàn)，通過實際運行代碼的方式去深入理解每一步的具體處理方法。最后，本書能夠順利成書，離不開作者在福井大學(xué)的教育科研活動中取得的經(jīng)驗。在此向福井大學(xué)的各位教職工和學(xué)生表示衷心的感謝。另外，借成書之際，也特別對Ohmsha出版社的各位編輯表示由衷的感謝。最后，我也要感謝支持我寫作的家人們。小高知宏 2017年9月

目錄譯者序原書前言第1章強化學(xué)習(xí)和深度學(xué)習(xí) 1.1 機器學(xué)習(xí)和強化學(xué)習(xí) 1.1.1 人工智能 1.1.2 機器學(xué)習(xí) 1.1.3 強化學(xué)習(xí) 1.2 深度學(xué)習(xí) 1.2.1 神經(jīng)網(wǎng)絡(luò) 1.2.2 深度學(xué)習(xí)的出現(xiàn) 1.3 深度強化學(xué)習(xí) 1.3.1 深度強化學(xué)習(xí)概述 1.3.2 深度強化學(xué)習(xí)的實現(xiàn) 1.3.3 基本機器學(xué)習(xí)系統(tǒng)的搭建實例———例題程序的執(zhí)行方法第2章強化學(xué)習(xí)的實例 2.1 強化學(xué)習(xí)和Q學(xué)習(xí) 2.1.1 強化學(xué)習(xí)的基本思想 2.1.2 Q學(xué)習(xí)的算法 2.2 Q學(xué)習(xí)實例 2.2.1 q21.c編程實例 2.2.2 目標探尋問題的學(xué)習(xí)程序第3章深度學(xué)習(xí)技術(shù) 3.1 實現(xiàn)深度學(xué)習(xí)的技術(shù) 3.1.1 神經(jīng)細胞的活動和階層型神經(jīng)網(wǎng)絡(luò) 3.1.2 階層型神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí) 3.1.3 階層型神經(jīng)網(wǎng)絡(luò)的編程實例（1）:單個神經(jīng)細胞的學(xué)習(xí)程序nn1.c 3.1.4 階層型神經(jīng)網(wǎng)絡(luò)的編程實例（2）:基于誤差逆?zhèn)鞑シǖ纳窠?jīng)網(wǎng)絡(luò)學(xué)習(xí)程序nn2.c 3.1.5 階層型神經(jīng)網(wǎng)絡(luò)的編程實例（3）:具有多個輸出的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)程序nn3.c 3.2 基于卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí) 3.2.1 卷積神經(jīng)網(wǎng)絡(luò)的算法 3.2.2 卷積神經(jīng)網(wǎng)絡(luò)的編程實例第4章深度強化學(xué)習(xí) 4.1 基于強化學(xué)習(xí)和深度學(xué)習(xí)融合的深度強化學(xué)習(xí) 1 4.1.1 在Q學(xué)習(xí)中應(yīng)用神經(jīng)網(wǎng)絡(luò) 4.1.2 Q學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)的融合 4.2 深度強化學(xué)習(xí)的編程實例 4.2.1 岔路選擇問題的深度強化學(xué) 習(xí)程序q21dl.c 4.2.2 目標探尋問題的深度強化學(xué) 習(xí)程序q22dl.c 參考文獻

你還可能感興趣

我要評論