人工智能超入門叢書--視覺感知:深度學(xué)習(xí)如何知圖辨物
定 價:69.8 元
叢書名:人工智能超入門叢書
- 作者:龔超、王冀、袁元 著
- 出版時間:2023/1/1
- ISBN:9787122422880
- 出 版 社:化學(xué)工業(yè)出版社
- 中圖法分類:TP391.41-49
- 頁碼:213
- 紙張:
- 版次:01
- 開本:32開
“人工智能超入門叢書”致力于面向人工智能各技術(shù)方向零基礎(chǔ)的讀者,內(nèi)容涉及數(shù)據(jù)思維、機(jī)器學(xué)習(xí)、視覺感知、情感分析、搜索算法、強(qiáng)化學(xué)習(xí)、知識圖譜、專家系統(tǒng)等方向,體系完整、內(nèi)容簡潔、文字通俗,綜合介紹人工智能相關(guān)知識,并輔以程序代碼解決問題,使得零基礎(chǔ)的讀者快速入門。
《視覺感知:深度學(xué)習(xí)如何知圖辨物》是“人工智能超入門叢書”中的分冊,本分冊主要介紹人工智能視覺領(lǐng)域的相關(guān)知識,以通俗易懂的文字風(fēng)格,解讀用卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)算法及機(jī)器學(xué)習(xí)算法對圖像進(jìn)行分類和識別的方法,介紹OpenCV在圖像處理中的基礎(chǔ)知識,為進(jìn)一步學(xué)習(xí)高階內(nèi)容奠定基礎(chǔ)。同時,本書配有關(guān)鍵代碼,讓讀者在學(xué)習(xí)過程中快速上手,提升解決問題的能力。
本書可以作為大學(xué)生以及想要走向計算機(jī)視覺相關(guān)工作崗位的技術(shù)人員的入門讀物,同時,對人工智能感興趣的人群也可以閱讀。
第1章 計算機(jī)視覺綜述 001
1.1 生物的視界 002
1.1.1 三只眼 002
1.1.2 眼見為實? 005
1.2 人工智能的視界 009
1.2.1 數(shù)字圖像類型 009
1.2.2 從圖像到矩陣 011
1.2.3 視不同,理相通 014
1.3 計算機(jī)視覺發(fā)展與應(yīng)用 018
1.3.1 計算機(jī)視覺發(fā)展史 018
1.3.2 大規(guī)模視覺識別挑戰(zhàn)賽 021
1.3.3 計算機(jī)視覺應(yīng)用 022
第2章 機(jī)器學(xué)習(xí)與圖像識別 024
2.1 從感知機(jī)到支持向量機(jī) 025
2.1.1 感知機(jī)的線性可分 025
2.1.2 支持向量機(jī) 027
2.2 支持向量機(jī)的超強(qiáng)“核”心 030
2.3 支持向量機(jī)的實踐 034
2.3.1 鳶尾花的辨識 034
2.3.2 手寫數(shù)字圖像識別 040
第3章 神經(jīng)網(wǎng)絡(luò)與圖像分類 043
3.1 從神經(jīng)元到神經(jīng)網(wǎng)絡(luò) 044
3.1.1 神經(jīng)元與感知機(jī) 044
3.1.2 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu) 046
3.1.3 前向與反向傳播 047
3.2 激活函數(shù)與損失函數(shù) 052
3.2.1 非線性轉(zhuǎn)換的激活函數(shù) 052
3.2.2 衡量優(yōu)劣的損失函數(shù) 056
3.2.3 激活函數(shù)與損失函數(shù)的組合 057
3.3 擬合與誤差 058
3.3.1 過擬合與欠擬合 058
3.3.2 偏差與方差的權(quán)衡 060
3.4 利用神經(jīng)網(wǎng)絡(luò)識別手寫數(shù)字圖像 064
3.4.1 MNIST手寫數(shù)字圖像數(shù)據(jù)集 064
3.4.2 Scikit-learn庫神經(jīng)網(wǎng)絡(luò)與手寫數(shù)字圖像 066
3.4.3 NumPy庫神經(jīng)網(wǎng)絡(luò)與手寫數(shù)據(jù)集 069
第4章 卷積入門 073
4.1 圖像噪聲 074
4.2 卷積核與去噪 077
4.3 邊緣檢測 085
4.4 紋理分析 089
第5章 卷積神經(jīng)網(wǎng)絡(luò)及經(jīng)典詳解 092
5.1 卷積神經(jīng)網(wǎng)絡(luò)的提出 093
5.1.1 從全局到局部 093
5.1.2 感受野 096
5.2 卷積層、池化層與全連接層 097
5.2.1 卷積與卷積層 098
5.2.2 池化與池化層 100
5.2.3 全連接層 101
5.3 卷積神經(jīng)網(wǎng)絡(luò)的圖像分類 103
5.3.1 CIFAR-10圖像集介紹 103
5.3.2 簡單實現(xiàn)圖像分類 104
5.4 ImageNet與經(jīng)典網(wǎng)絡(luò)介紹 113
5.4.1 ImageNet數(shù)據(jù)集 113
5.4.2 經(jīng)典卷積神經(jīng)網(wǎng)絡(luò) 114
第6章 OpenCV基礎(chǔ) 118
6.1 圖像處理入門 120
6.1.1 讀取、顯示與保存圖像 121
6.1.2 分割與合并顏色通道 126
6.1.3 轉(zhuǎn)換顏色空間 128
6.1.4 讀取、顯示與保存視頻 131
6.2 圖像基本變換 135
6.2.1 操作單個像素 135
6.2.2 裁剪圖像 138
6.2.3 調(diào)整圖像大小 140
6.2.4 翻轉(zhuǎn)圖像 144
6.3 為圖像添加注釋 146
6.3.1 為圖像添加線段 147
6.3.2 為圖像添加圓 148
6.3.3 為圖像添加矩形 149
6.3.4 為圖像添加文本 150
6.4 圖像增強(qiáng) 151
6.4.1 調(diào)整圖像亮度 151
6.4.2 調(diào)整圖像對比度 153
第7章 OpenCV實戰(zhàn)應(yīng)用 157
7.1 目標(biāo)跟蹤 158
7.1.1 目標(biāo)跟蹤算法 159
7.1.2 創(chuàng)建跟蹤器實例 160
7.2 目標(biāo)檢測 169
7.2.1 SSD目標(biāo)檢測算法 169
7.2.2 目標(biāo)檢測實例 170
7.3 圖像分割 177
7.3.1 圖像分割介紹 178
7.3.2 通過Mask R-CNN進(jìn)行圖像分割 179
7.4 人臉識別 181
7.4.1 人臉檢測實例 182
7.4.2 眼睛檢測實例 187
附錄 189
附錄一 優(yōu)化基礎(chǔ) 190
附錄二 神經(jīng)網(wǎng)絡(luò)代碼 198
附錄三 騰訊扣叮Python實驗室:Jupyter Lab使用說明 205