本書基于谷歌的深度學習框架tensorflow,深入講解其語法特點,以及使用方法,并在此基礎上選取了圖像領域的多個應用進行深入講解,原理由淺入深,算法推導細致到位,結(jié)合大量的圖片,以及運行中間結(jié)果,進行了細致的分析。
本書基于谷歌的深度學習框架tensorflow,深入講解其語法特點,以及使用方法,并在此基礎上選取了圖像領域的多個應用進行深入講解,原理由淺入深,算法推導細致到位,結(jié)合大量的圖片,以及運行中間結(jié)果,進行了細致的分析。
1、本書由淺入深詳細講解了tensorflow的語法特點,并在圖像領域做了專門的應用介紹,相信通過該書循序漸進的學習,能夠快速掌握tensorflow的語法,并能在圖像領域快速上手。
2、圖像應用從基礎的字符識別,目標檢測,目標定位,目標識別再到GAN網(wǎng)絡,覆蓋到現(xiàn)階段大部分的圖像應用,算法原理的詳細介紹,配上豐富的中間結(jié)果展示,圖文并茂,相信對讀者理解算法,吃透算法能起到很大的幫助。
3、內(nèi)容從淺入深,應用從簡單到復雜,原理詳實,詳細。
4、從技術的角度,本書使用通俗易懂的語言描述相對復雜的問題,包含對TensorFlow的原理、特性、使用方法以及應用技巧等的描述,特別是結(jié)合具體實例進行講解的方式,有利于讀者直觀、快速地掌握有關的技能。
楊虹,重慶市半導體行業(yè)協(xié)會副理事長,重慶市電子學會常務理事,重慶市高校青年骨干教師。現(xiàn)任重慶郵電大學光電工程學院副院長。
謝顯中,男,教授,工學博士,博士生導師,F(xiàn)為重慶郵電大學光電工程學院院長、重慶國際半導體學院執(zhí)行院長,兼任計算機網(wǎng)絡與通信技術信息產(chǎn)業(yè)部/重慶市重點實驗室主任、重慶郵電大學個人通信研究所所長。
第1章 緒論 1
1.1 機器學習簡介 1
1.2 機器學習流程 2
1.3 深度學習簡介 3
第2章 TensorFlow簡介與環(huán)境搭建 4
2.1 TensorFlow簡介 4
2.2 TensorFlow 的語言支持 4
2.3 TensorFlow的安裝和環(huán)境配置 5
2.3.1 Python安裝 5
2.3.2 CUDA與CUDNN安裝 11
2.4 TensorFlow安裝 12
2.4.1 pip安裝 12
2.4.2 Docker安裝 13
2.5 測試TensorFlow 13
第3章 TensorFlow入門 14
3.1 TensorFlow靜態(tài)圖模式 14
3.1.1 TensorFlow中的張量類型 14
3.1.2 TensorFlow的操作符簡介 17
3.1.3 TensorFlow的Graph和
Session 23
3.2 TensorFlow動態(tài)圖模式 27
3.3 TensorFlow 損失函數(shù) 28
3.3.1 交叉熵 28
3.3.2 均方誤差 29
3.3.3 KL散度 29
3.4 TensorFlow優(yōu)化器 30
3.5 TensorFlow訓練數(shù)據(jù)輸入 33
3.5.1 tf.data.Dataset 33
3.5.2 tf.data.Iterator 35
第4章 聚類算法 37
4.1 聚類算法簡介 37
4.2 k均值聚類算法 38
4.2.1 算法步驟 38
4.2.2 準則函數(shù) 39
4.2.3 算法改進 39
4.3 k中心聚類算法 43
4.3.1 準則函數(shù) 43
4.3.2 算法步驟 43
4.3.3 算法對比 43
第5章 分類算法 45
5.1 分類算法簡介 45
5.2 k近鄰算法 45
5.2.1 算法步驟 46
5.2.2 投票算法改進 46
5.2.3 k參數(shù)選取 46
5.2.4 模型評價 47
5.3 樸素貝葉斯 49
5.3.1 算法步驟 50
5.3.2 概率處理 50
5.3.3 連續(xù)值概率計算 51
5.4 決策樹 53
5.4.1 分裂函數(shù) 53
5.4.2 特征為連續(xù)特征 54
5.4.3 決策樹終止條件 55
5.5 支持向量機 55
5.5.1 線性可分支持向量機 56
5.5.2 近似線性可分支持向量機 59
5.5.3 非線性支持向量機 60
5.5.4 常用核函數(shù) 60
5.5.5 多分類支持向量機 61
5.6 人工神經(jīng)網(wǎng)絡 61
5.6.1 激活函數(shù) 62
5.6.2 邏輯門設計 64
5.6.3 多層感知器 67
5.6.4 前向傳播算法 67
5.6.5 反向傳播算法 68
第6章 回歸算法 72
6.1 線性回歸 72
6.1.1 最小二乘法 72
6.1.2 廣義逆 74
6.1.3 嶺回歸與Lasso回歸 76
6.1.4 梯度求解算法 78
6.2 非線性回歸 84
6.2.1 指數(shù)變換 84
6.2.2 對數(shù)變換 85
6.2.3 冪等變換 85
6.2.4 多項式變換 85
6.3 邏輯回歸 85
6.3.1 二值邏輯回歸 86
6.3.2 多元邏輯回歸 89
6.4 決策樹回歸 91
6.4.1 代價函數(shù) 92
6.4.2 算法流程 92
6.4.3 舉例 93
6.5 梯度算法 94
6.5.1 隨機梯度下降法 95
6.5.2 牛頓法 96
第7章 MNIST數(shù)據(jù)集 99
7.1 MNIST數(shù)據(jù)集簡介 99
7.2 LeNet的實現(xiàn)與講解 101
7.2.1 網(wǎng)絡參數(shù)設置和輸入設置 101
7.2.2 LeNet網(wǎng)絡模型詳解 102
7.2.3 更簡潔的實現(xiàn) 107
7.2.4 softmax層和網(wǎng)絡更新方式 108
7.2.5 訓練過程 108
7.3 FashionMNIST數(shù)據(jù)集 109
第8章 圖像分類 110
8.1 圖像分類的概念 110
8.2 圖像分類的常用網(wǎng)絡結(jié)構(gòu) 111
8.2.1 AlexNet網(wǎng)絡結(jié)構(gòu) 111
8.2.2 VGGNet網(wǎng)絡結(jié)構(gòu) 113
8.2.3 Network In Network網(wǎng)絡
結(jié)構(gòu) 114
8.2.4 GoogLeNet網(wǎng)絡結(jié)構(gòu) 117
8.2.5 ResNet網(wǎng)絡結(jié)構(gòu) 119
8.3 圖像多標簽分類實例 121
8.3.1 使用TFRecord生成訓練
數(shù)據(jù) 121
8.3.2 構(gòu)建多標簽分類網(wǎng)絡 122
8.3.3 多標簽模型訓練模型 125
第9章 目標檢測 127
9.1 目標檢測的概念 127
9.1.1 Faster R-CNN 127
9.1.2 YOLO 128
9.1.3 SSD 130
9.2 基于SSD的目標檢測實例 131
9.2.1 基于VGG的SSD網(wǎng)絡 131
9.2.2 坐標和類別預測 133
9.2.3 多尺度的預測拼接 133
9.2.4 損失函數(shù)與模型訓練 133
第10章 圖像檢索應用 135
10.1 圖像檢索的基本概念 135
10.2 圖像檢索特征提取的常用方法 137
10.3 基于VGG的圖像檢索實例 140
10.3.1 使用TFRecord生成訓練
數(shù)據(jù) 140
10.3.2 模型訓練函數(shù) 141
10.3.3 檢索系統(tǒng)構(gòu)建 141
第11章 光學字符識別應用 143
11.1 光學字符識別的概念 143
11.2 光學字符識別的常用算法與
流程 144
11.2.1 文本檢測環(huán)節(jié) 144
11.2.2 文本識別環(huán)節(jié) 145
11.3 基于CNN-RNN-CTC的光學
字符識別算法實例 146
11.3.1 光學字符識別訓練數(shù)據(jù)
生成 146
11.3.2 使用TFRecord生成訓練
數(shù)據(jù) 148
11.3.3 構(gòu)建基于CNN-RNN-CTC
的光學字符識別網(wǎng)絡 149
第12章 中文分詞 152
12.1 自然語言處理 152
12.2 中文分詞簡介 153
12.2.1 BMES 153
12.2.2 BM12ES 154
12.3 文字單元嵌入表達 154
12.3.1 文字單元的獨熱嵌入表達 154
12.3.2 word2Vector 155
12.3.3 word2Vector代碼實現(xiàn) 161