計(jì)算機(jī)視覺是一門研究和應(yīng)用學(xué)科,它研究如何使用計(jì)算機(jī)來處理和理解圖像與視頻,該研究領(lǐng)域涵蓋了從圖像采集和處理到圖像分析和識(shí)別等多項(xiàng)技術(shù)。它的目標(biāo)是使計(jì)算機(jī)能夠像人類一樣理解視覺信息,并且能夠自動(dòng)執(zhí)行視覺任務(wù)。本書是一本以應(yīng)用為導(dǎo)向的計(jì)算機(jī)視覺案例教材,全書共分11章。第1章講述計(jì)算機(jī)視覺概述;第2章講述系統(tǒng)環(huán)境搭建;第3章主要講述圖像處理基礎(chǔ);第4章主要講述圖像濾波;第5章講述圖像特征提取和匹配;第6章講述圖像分割基礎(chǔ);第7章講述基于經(jīng)典機(jī)器學(xué)習(xí)的圖像分類;第8章講述基于全連接網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的圖像分類基礎(chǔ);第9章講述基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類程序的規(guī)范寫法;第10章講述基于YOLO的目標(biāo)檢測和物體追蹤;第11章講述基于深度學(xué)習(xí)的人臉檢測、人臉識(shí)別和表情識(shí)別。前7章主要講述必要的理論基礎(chǔ)和基于經(jīng)典機(jī)器學(xué)習(xí)的計(jì)算機(jī)視覺;后4章主要講述基于深度學(xué)習(xí)的計(jì)算機(jī)視覺。學(xué)習(xí)本書學(xué)生有必要的Python基礎(chǔ)知識(shí)即可,無須事先學(xué)習(xí)深度學(xué)習(xí)課程,最好具備一定的機(jī)器學(xué)習(xí)基礎(chǔ)。本書希望做到:知識(shí)技能較系統(tǒng),寫法深入淺出,案例有較好的實(shí)用性;能幫助學(xué)生入門,能幫助學(xué)生樹立解決問題的信心。
劉小華,深職院人工智能學(xué)院軟件技術(shù)專業(yè)主任,主要從事人工智能技術(shù)的教學(xué)和科研工作。開發(fā)的軟件系統(tǒng)從2004年起在深職院使用至今,累計(jì)承擔(dān)省、市、校各級(jí)教學(xué)科研課題十余項(xiàng),發(fā)表EI檢索及核心期刊論文多篇,獲得發(fā)明專利授權(quán)一項(xiàng)。指導(dǎo)學(xué)生參加技能大賽獲省一等獎(jiǎng)以上十余次,獲百度人工智能菁英班優(yōu)秀指導(dǎo)教師等榮譽(yù)稱號(hào)多次。曾承擔(dān)深圳大學(xué)SPOC課程制作。2020年開發(fā)的全英文課程上線"學(xué)堂在線”國際版。
第1章 計(jì)算機(jī)視覺概述 1
1.1 從人類視覺系統(tǒng)到計(jì)算機(jī)視覺 1
1.2 計(jì)算機(jī)視覺與人工智能 7
1.3 計(jì)算機(jī)視覺應(yīng)用 9
1.4 課后習(xí)題 13
1.5 本章小結(jié) 15
第2章 系統(tǒng)環(huán)境搭建 16
2.1 項(xiàng)目1 搭建計(jì)算機(jī)視覺應(yīng)用開發(fā)的系統(tǒng)環(huán)境 16
2.2 課后習(xí)題 35
2.3 本章小結(jié) 35
第3章 圖像處理基礎(chǔ) 36
3.1 項(xiàng)目2 把logo貼到大圖右下角 36
3.2 課后習(xí)題 61
3.3 本章小結(jié) 64
第4章 圖像濾波 65
4.1 項(xiàng)目3 交通視頻中的車道線檢測和繪制 65
4.2 課后習(xí)題 102
4.3 本章小結(jié) 106
第5章 圖像特征提取和匹配 107
5.1 項(xiàng)目4 基于特征提取的logo定位 107
5.2 課后習(xí)題 120
5.3 本章小結(jié) 121
第6章 圖像分割基礎(chǔ) 122
6.1 項(xiàng)目5 數(shù)獨(dú)圖像中題干已知數(shù)字的分割 122
6.2 課后習(xí)題 142
6.3 本章小結(jié) 144
第7章 使用經(jīng)典機(jī)器學(xué)習(xí)方法的目標(biāo)檢測和圖像分類 145
7.1 項(xiàng)目6 使用SVM完成圖片中的多車檢測 145
7.2 項(xiàng)目7 使用KNN識(shí)別印刷體數(shù)字 157
7.3 課后習(xí)題 165
7.4 本章小結(jié) 166
第8章 基于深度學(xué)習(xí)的圖像分類基礎(chǔ) 167
8.1 項(xiàng)目8 基于全連接網(wǎng)絡(luò)的圖像分類 167
8.2 項(xiàng)目9 基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的圖像分類 187
8.3 課后習(xí)題 197
8.4 本章小結(jié) 199
第9章 復(fù)雜深度學(xué)習(xí)項(xiàng)目的規(guī)范寫法 200
9.1 項(xiàng)目10 基于本地?cái)?shù)據(jù)的貓狗圖像分類 200
9.2 課后習(xí)題 232
9.3 本章小結(jié) 232
第10章 基于深度學(xué)習(xí)的物體追蹤 233
10.1 項(xiàng)目11 基于YOLOv3的行人追蹤 233
10.2 課后習(xí)題 246
10.3 本章小結(jié) 247
第11章 基于深度學(xué)習(xí)的人臉相關(guān)應(yīng)用 248
11.1 項(xiàng)目12 人臉檢測、人臉識(shí)別和表情識(shí)別 248
11.2 課后習(xí)題 295
11.3 本章小結(jié) 296
附錄A:術(shù)語表 297
附錄B:基于Ubuntu操作系統(tǒng)和CPU的系統(tǒng)環(huán)境搭建 300
附錄C:基于Ubuntu操作系統(tǒng)和GPU的系統(tǒng)環(huán)境搭建 303
附錄D:CPU下的TensorFlow和Python版本對(duì)應(yīng)關(guān)系 311
附錄E:GPU下的TensorFlow、Python、CUDA和cuDNN版本對(duì)應(yīng)關(guān)系 313