強化學(xué)習(xí)與深度學(xué)習(xí)
定 價:59 元
- 作者:(日)小高知宏著;張小猛譯
- 出版時間:2019/7/1
- ISBN:9787111627180
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP181
- 頁碼:159頁:圖;24m
- 紙張:膠版紙
- 版次:1
- 開本:16K
本書共4章。第1章介紹了人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)、強化學(xué)習(xí)的基本概念。第2章以Q學(xué)習(xí)為例,重點介紹了強化學(xué)習(xí)的原理、算法步驟、代碼實現(xiàn)、代碼運行調(diào)試。第3章先對深度學(xué)習(xí)的幾種常見的類型和原理進行介紹,然后給出了例程和調(diào)試方法。第4章以Q學(xué)習(xí)中運用神經(jīng)網(wǎng)絡(luò)為例,介紹了深度強化學(xué)習(xí)的基本原理和方法,同時也給出了例程和調(diào)試方法。
適讀人群 :想要獲得深度學(xué)習(xí)進階知識、強化學(xué)習(xí)技術(shù)及其應(yīng)用實踐的學(xué)生、從業(yè)者,特別是立志從事AI相關(guān)行業(yè)的人士
在人工智能的學(xué)習(xí)熱潮中,深度學(xué)習(xí)和強化學(xué)習(xí)無疑是亮眼的兩個明星。掌握深度學(xué)習(xí)原理,理解強化學(xué)習(xí)概念,對于能夠在人工智能發(fā)展中立于有利之地的您,無疑是必須且非常重要的。《強化學(xué)習(xí)與深度學(xué)習(xí):通過C語言模擬》不僅綜合了兩種學(xué)習(xí)的概念,更重要是給出了多個有趣且生動的案例,為您的學(xué)習(xí)鋪平了道路。
原書前言
近年來,被稱為“深度學(xué)習(xí)”的機器學(xué)習(xí)方法在諸多領(lǐng)域取得了成功。深度學(xué)習(xí)誕生 之初,在圖像處理領(lǐng)域中為圖像識別率取得歷史性突破做出了非常大的貢獻。隨后,隨著深 度學(xué)習(xí)的不斷發(fā)展,深度學(xué)習(xí)不局限于應(yīng)用在圖像處理領(lǐng)域,在各種各樣的機器學(xué)習(xí)應(yīng)用領(lǐng) 域都取得了非常顯著的成果。
在深度學(xué)習(xí)的成功案例中,有一個基于強化學(xué)習(xí)的深度學(xué)習(xí)技術(shù)應(yīng)用方向。強化學(xué)習(xí)是 單純從一系列行動的結(jié)果進行行動知識學(xué)習(xí)的方法。在強化學(xué)習(xí)中引入深度學(xué)習(xí)的方法,一 般我們稱為深度強化學(xué)習(xí)。關(guān)于深度強化學(xué)習(xí)成功案例的應(yīng)用報道非常多,例如,通過運用 深度強化學(xué)習(xí),計算機能夠在汽車轉(zhuǎn)向盤操控方面獲得超越人類的技能;通過運用深度強化 學(xué)習(xí),可以制造出能夠打敗圍棋世界冠軍的AI圍棋棋手等。
本書首先對強化學(xué)習(xí)和深度學(xué)習(xí)的基礎(chǔ)知識進行介紹,然后在此基礎(chǔ)上,再對深度強化 學(xué)習(xí)的原理和機制進行具體說明。同時,本書不僅僅是在概念上的說明,而是對具體算法用 C語言進行了編碼和實現(xiàn),通過實際運行代碼的方式去深入理解每一步的具體處理方法。
最后,本書能夠順利成書,離不開作者在福井大學(xué)的教育科研活動中取得的經(jīng)驗。在此 向福井大學(xué)的各位教職工和學(xué)生表示衷心的感謝。另外,借成書之際,也特別對Ohmsha出 版社的各位編輯表示由衷的感謝。最后,我也要感謝支持我寫作的家人們。
小高知宏
2017年9月
目錄
譯者序
原書前言
第1章 強化學(xué)習(xí)和深度學(xué)習(xí)
1.1 機器學(xué)習(xí)和強化學(xué)習(xí)
1.1.1 人工智能
1.1.2 機器學(xué)習(xí)
1.1.3 強化學(xué)習(xí)
1.2 深度學(xué)習(xí)
1.2.1 神經(jīng)網(wǎng)絡(luò)
1.2.2 深度學(xué)習(xí)的出現(xiàn)
1.3 深度強化學(xué)習(xí)
1.3.1 深度強化學(xué)習(xí)概述
1.3.2 深度強化學(xué)習(xí)的實現(xiàn)
1.3.3 基本機器學(xué)習(xí)系統(tǒng)的搭建實例———例題程序的執(zhí)行方法
第2章 強化學(xué)習(xí)的實例
2.1 強化學(xué)習(xí)和Q學(xué)習(xí)
2.1.1 強化學(xué)習(xí)的基本思想
2.1.2 Q學(xué)習(xí)的算法
2.2 Q學(xué)習(xí)實例
2.2.1 q21.c編程實例
2.2.2 目標探尋問題的學(xué)習(xí)程序
第3章 深度學(xué)習(xí)技術(shù)
3.1 實現(xiàn)深度學(xué)習(xí)的技術(shù)
3.1.1 神經(jīng)細胞的活動和階層型 神經(jīng)網(wǎng)絡(luò)
3.1.2 階層型神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)
3.1.3 階層型神經(jīng)網(wǎng)絡(luò)的編程實 例(1):單個神經(jīng)細胞的學(xué)習(xí)程序nn1.c
3.1.4 階層型神經(jīng)網(wǎng)絡(luò)的編程實 例(2):基于誤差逆?zhèn)鞑シǖ纳窠?jīng)網(wǎng)絡(luò)學(xué)習(xí)程序nn2.c
3.1.5 階層型神經(jīng)網(wǎng)絡(luò)的編程實 例(3):具有多個輸出的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)程序nn3.c
3.2 基于卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)
3.2.1 卷積神經(jīng)網(wǎng)絡(luò)的算法
3.2.2 卷積神經(jīng)網(wǎng)絡(luò)的編程實例
第4章 深度強化學(xué)習(xí)
4.1 基于強化學(xué)習(xí)和深度學(xué)習(xí)融合的深度強化學(xué)習(xí) 1
4.1.1 在Q學(xué)習(xí)中應(yīng)用神經(jīng)網(wǎng)絡(luò)
4.1.2 Q學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)的融合
4.2 深度強化學(xué)習(xí)的編程實例
4.2.1 岔路選擇問題的深度強化學(xué) 習(xí)程序q21dl.c
4.2.2 目標探尋問題的深度強化學(xué) 習(xí)程序q22dl.c
參考文獻