定 價(jià):98 元
叢書(shū)名:工業(yè)和信息化部“十四五”規(guī)劃教材
- 作者:楊小遠(yuǎn),劉建偉
- 出版時(shí)間:2023/10/1
- ISBN:9787030760531
- 出 版 社:科學(xué)出版社
- 中圖法分類(lèi):TP181
- 頁(yè)碼:364
- 紙張:
- 版次:31
- 開(kāi)本:B5
本書(shū)兼顧深度學(xué)習(xí)的理論和應(yīng)用,特別強(qiáng)調(diào)大規(guī)模訓(xùn)練應(yīng)用案例,引導(dǎo)學(xué)生進(jìn)人深度學(xué)習(xí)的前沿領(lǐng)域.主要內(nèi)容有深度學(xué)習(xí)的核心理論問(wèn)題:網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)設(shè)計(jì)、網(wǎng)絡(luò)參數(shù)初始化方法. 大規(guī)模網(wǎng)絡(luò)訓(xùn)練的優(yōu)化方法、正則化方法、激活函數(shù)的研究方法. 書(shū)中引人深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)中的大型經(jīng)典和前沿應(yīng)用案例,包括圖像分類(lèi)任務(wù). 目標(biāo)檢測(cè)與跟蹤任務(wù)、多源遙感圖像融合任務(wù)、超分辨率任務(wù). 圖像隱寫(xiě)與圖像信息安全任務(wù)等內(nèi)容. 本書(shū)擁有豐富的數(shù)字化資源,掃描每章末二維碼即可觀(guān)看學(xué)習(xí).
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
目錄
前言
第1章 計(jì)算機(jī)視覺(jué)任務(wù)的基礎(chǔ)知識(shí) 1
1.1 遙感圖像基礎(chǔ)知識(shí) 1
1.1.1 遙感和遙感系統(tǒng) 1
1.1.2 遙感圖像成像機(jī)制 2
1.1.3 遙感圖像特征 2
1.2 遙感圖像融合基礎(chǔ)知識(shí) 4
1.2.1 遙感圖像融合背景 4
1.2.2 遙感圖像融合類(lèi)型 5
1.2.3 遙感圖像融合實(shí)現(xiàn)原理 6
1.3 遙感圖像超分辨率任務(wù)基礎(chǔ)知識(shí) 12
1.3.1 遙感圖像超分辨率背景 12
1.3.2 遙感圖像超分辨率實(shí)現(xiàn)原理 13
1.4 目標(biāo)檢測(cè)基礎(chǔ)知識(shí) 16
1.4.1 目標(biāo)檢測(cè)任務(wù)基本原理 16
1.4.2 目標(biāo)檢測(cè)任務(wù)常用評(píng)價(jià)指標(biāo)及計(jì)算方法 18
1.5 目標(biāo)跟蹤基礎(chǔ)知識(shí) 20
1.6 數(shù)據(jù)集 22
1.6.1 圖像分類(lèi)常用數(shù)據(jù)集 22
1.6.2 目標(biāo)檢測(cè)任務(wù)常用數(shù)據(jù)集 24
1.6.3 目標(biāo)跟蹤任務(wù)常用數(shù)據(jù)集和評(píng)價(jià)標(biāo)準(zhǔn) 25
1.6.4 遙感圖像數(shù)據(jù)集 29
1.6.5 圖像隱寫(xiě)數(shù)據(jù)集 30
1.6.6 人臉圖像數(shù)據(jù)集 31
1.7 數(shù)字化資源 31
第2章 神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ) 32
2.1 神經(jīng)元工作的數(shù)學(xué)表示 32
2.1.1 神經(jīng)元工作的數(shù)學(xué)表示 32
2.1.2 神經(jīng)元的一般化 33
2.2 什么是神經(jīng)網(wǎng)絡(luò) 34
2.2.1 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu) 35
2.2.2 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練 37
2.2.3 神經(jīng)網(wǎng)絡(luò)的參數(shù)和變量 38
2.2.4 神經(jīng)網(wǎng)絡(luò)的代價(jià)函數(shù)和參數(shù)訓(xùn)練 39
2.3 隨機(jī)梯度下降 40
2.4 神經(jīng)網(wǎng)絡(luò)正則化初步 45
2.4.1 模型選擇,欠擬合和過(guò)擬合 45
2.4.2 權(quán)重衰減 49
2.4.3 丟棄法 51
2.5 卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)55
2.5.1 卷積神經(jīng)網(wǎng)絡(luò)的基本思想 55
2.5.2 卷積神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)表示 56
2.5.3 卷積神經(jīng)網(wǎng)絡(luò)的誤差反向傳播 60
2.6 殘差網(wǎng)絡(luò) 64
2.7 基于卷積神經(jīng)網(wǎng)絡(luò)的視覺(jué)注意力機(jī)制 67
2.7.1 空間域注意力 67
2.7.2 通道域注意力 69
2.7.3 混合域注意力 72
2.8 數(shù)字化資源 74
第3章 經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 75
3.1 手寫(xiě)數(shù)字識(shí)別任務(wù)75
3.2 圖像分類(lèi)任務(wù) 77
3.2.1 圖像分類(lèi)研究背景 77
3.2.2 經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu): AlexNet 78
3.2.3 經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu): ResNet 80
3.2.4 經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu): GoogLeNet 84
3.3 數(shù)字化資源 87
第4章 激活函數(shù)的研究 88
4.1 激活函數(shù)的基本性質(zhì) 88
4.1.1 無(wú)激活函數(shù)的神經(jīng)網(wǎng)絡(luò) 88
4.1.2 配備激活函數(shù)的神經(jīng)網(wǎng)絡(luò) 90
4.2 激活函數(shù)的理論分析 92
4.2.1 飽和激活函數(shù) 92
4.2.2 梯度消失和梯度爆炸問(wèn)題 92
4.3 不可訓(xùn)練的激活函數(shù) 95
4.3.1 經(jīng)典激活函數(shù) 95
4.3.2 整流型激活函數(shù) 99
4.4 可訓(xùn)練的激活函數(shù) 107
4.4.1 參數(shù)化標(biāo)準(zhǔn)激活函數(shù) 107
4.4.2 集成化激活函數(shù) 113
4.5 激活函數(shù)實(shí)驗(yàn)分析 119
4.5.1 CIFAR-10/100的實(shí)驗(yàn) 119
4.5.2 ImageNet的實(shí)驗(yàn) 126
4.6 數(shù)字化資源 130
第5章 深度學(xué)習(xí)的優(yōu)化算法 131
5.1 優(yōu)化算法與深度學(xué)習(xí) 131
5.1.1 優(yōu)化算法與深度學(xué)習(xí)的關(guān)系 131
5.1.2 優(yōu)化算法在深度學(xué)習(xí)中的挑戰(zhàn) 131
5.2 隨機(jī)梯度下降算法 134
5.3 動(dòng)量法 137
5.3.1 梯度下降的問(wèn)題 137
5.3.2 動(dòng)量法 139
5.3.3 指數(shù)加權(quán)移動(dòng)平均 141
5.3.4 從指數(shù)加權(quán)移動(dòng)平均來(lái)理解動(dòng)量法 142
5.3.5 NAG算法 142
5.4 自適應(yīng)梯度方法 145
5.4.1 AdaGrad算法 145
5.4.2 RMSProp算法 151
5.4.3 AdaDelta算法 155
5.4.4 Adam算法 157
5.4.5 AdaMax算法 164
5.5 優(yōu)化算法實(shí)驗(yàn)分析 166
5.5.1 小型機(jī)翼噪聲回歸的實(shí)驗(yàn) 167
5.5.2 CIFAR-10的實(shí)驗(yàn) 171
5.5.3 ImageNet的實(shí)驗(yàn) 173
5.6 數(shù)字化資源 175
第6章 神經(jīng)網(wǎng)絡(luò)的正則化 176
6.1 理論框架 176
6.2 正則化方法 178
6.2.1 批量歸一化 178
6.2.2 權(quán)重衰減 182
6.2.3 Dropout 185
6.2.4 模型集成 188
6.2.5 數(shù)據(jù)擴(kuò)增 190
6.2.6 提前終止 192
6.2.7 標(biāo)簽平滑 193
6.2.8 多任務(wù)學(xué)習(xí) 195
6.2.9 添加噪聲 195
6.3 知識(shí)蒸餾技術(shù) 196
6.3.1 知識(shí)蒸餾 196
6.3.2 特征蒸餾 204
6.3.3 自蒸餾 209
6.4 數(shù)字化資源 212
第7章 網(wǎng)絡(luò)初始化方法 213
7.1 預(yù)備知識(shí) 213
7.1.1 常用隨機(jī)分布 213
7.1.2 隨機(jī)變量的性質(zhì) 213
7.2 Xavier初始化方法 214
7.3 Kaiming初始化方法 217
7.4 實(shí)驗(yàn)分析 221
7.4.1 Xavier初始化實(shí)驗(yàn) 221
7.4.2 Kaiming初始化實(shí)驗(yàn) 223
7.5 數(shù)字化資源 227
第8章 生成對(duì)抗網(wǎng)絡(luò)基本原理 228
8.1 生成對(duì)抗網(wǎng)絡(luò)的基本介紹 228
8.1.1 生成對(duì)抗網(wǎng)絡(luò)的結(jié)構(gòu) 228
8.1.2 生成對(duì)抗網(wǎng)絡(luò)的理論分析 230
8.1.3 原始生成對(duì)抗網(wǎng)絡(luò) 235
8.2 生成對(duì)抗網(wǎng)絡(luò)常見(jiàn)的模型結(jié)構(gòu) 237
8.2.1 條件生成對(duì)抗網(wǎng)絡(luò) 237
8.2.2 深度卷積生成對(duì)抗網(wǎng)絡(luò) 240
8.2.3 漸進(jìn)式增長(zhǎng)生成對(duì)抗網(wǎng)絡(luò) 243
8.2.4 對(duì)抗自編碼器 246
8.3 生成對(duì)抗網(wǎng)絡(luò)的訓(xùn)練問(wèn)題 249
8.3.1 生成對(duì)抗網(wǎng)絡(luò)存在的問(wèn)題 249
8.3.2 穩(wěn)定訓(xùn)練的策略 251
8.4 基于Wasserstein距離的生成對(duì)抗網(wǎng)絡(luò) 257
8.4.1 Wasserstein距離 257
8.4.2 基于Wasserstein距離的WGAN 258
8.5 數(shù)字化資源 261
第9章 基于卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算機(jī)視覺(jué)任務(wù) 262
9.1 遙感圖像融合任務(wù) 262
9.1.1 卷積神經(jīng)網(wǎng)絡(luò)與遙感圖像融合的關(guān)系 262
9.1.2 遙感圖像融合評(píng)價(jià)方法與評(píng)價(jià)指標(biāo) 263
9.1.3 基于卷積神經(jīng)網(wǎng)絡(luò)的遙感圖像融合方法:PNN 265
9.1.4 基于卷積神經(jīng)網(wǎng)絡(luò)的遙感圖像融合方法:PanNet 268
9.1.5 基于卷積神經(jīng)網(wǎng)絡(luò)的遙感圖像融合方法:CLGF 272
9.2 遙感圖像超分辨率任務(wù) 275
9.2.1 卷積神經(jīng)網(wǎng)絡(luò)與遙感圖像超分辨率的關(guān)系 275
9.2.2 遙感圖像超分辨率評(píng)價(jià)方法與評(píng)價(jià)指標(biāo) 276
9.2.3 基于卷積神經(jīng)網(wǎng)絡(luò)的超分辨率方法:SRCNN 276
9.2.4 基于卷積神經(jīng)網(wǎng)絡(luò)的超分辨率方法:ESRDNN 279
9.3 基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)任務(wù) 281
9.3.1 Two-Stage目標(biāo)檢測(cè)算法 281
9.3.2 One-Stage目標(biāo)檢測(cè)算法 287
9.4 基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)跟蹤任務(wù) 291
9.5 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像隱寫(xiě)任務(wù) 302
9.6 數(shù)字化資源 320
第10章 生成對(duì)抗網(wǎng)絡(luò)的應(yīng)用 321
10.1 基于生成對(duì)抗網(wǎng)絡(luò)的信息安全任務(wù) 321
10.1.1 基于生成對(duì)抗網(wǎng)絡(luò)的圖像隱寫(xiě)方法:HiDDeN 321
10.1.2 基于生成對(duì)抗網(wǎng)絡(luò)的信息加密方法:ANES 328
10.2 基于生成對(duì)抗網(wǎng)絡(luò)的計(jì)算機(jī)視覺(jué)任務(wù) 336
10.2.1 基于生成對(duì)抗網(wǎng)絡(luò)的超分辨率方法:SRGAN 336
10.2.2 基于生成對(duì)抗網(wǎng)絡(luò)的遙感圖像融合方法:PSGAN 339
10.3 數(shù)字化資源 342
參考文獻(xiàn) 343