機(jī)器視覺(jué)入門(mén)與實(shí)戰(zhàn):人臉識(shí)別與人體識(shí)別
定 價(jià):89 元
叢書(shū)名:智能系統(tǒng)與技術(shù)叢書(shū)
- 作者:夏東周波著
- 出版時(shí)間:2023/3/1
- ISBN:9787111721475
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類(lèi):TP302.7
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:
- 開(kāi)本:32開(kāi)
這是一本系統(tǒng)講解人臉識(shí)別和人體姿態(tài)識(shí)別技術(shù)、算法和應(yīng)用的實(shí)戰(zhàn)性著作,是作者團(tuán)隊(duì)多年研究成果和實(shí)踐經(jīng)驗(yàn)的總結(jié)。既有業(yè)界成熟的技術(shù)和算法,又有行業(yè)的新熱點(diǎn)和新趨勢(shì)。
通過(guò)本書(shū),讀者將能輕松掌握如下知識(shí):
機(jī)器視覺(jué)的概念以及索引技術(shù),包括向量空間索引和度量空間索引;
人臉識(shí)別技術(shù),以及人臉檢測(cè)算法、人臉對(duì)齊算法、人臉特征提取算法;
面向人臉檢索的高維空間快速索引技術(shù);
人體姿態(tài)識(shí)別技術(shù)、目標(biāo)檢測(cè)算法以及算法的性能評(píng)測(cè);
面向嵌入式設(shè)備的人臉識(shí)別技術(shù)與算法,輕量級(jí)的人臉識(shí)別技術(shù)與算法,以及面向ARM設(shè)備的人臉精準(zhǔn)識(shí)別方法VMFace;
人臉識(shí)別、人體姿態(tài)識(shí)別相關(guān)技術(shù)和算法在門(mén)禁、安防和運(yùn)動(dòng)訓(xùn)練等場(chǎng)景的應(yīng)用。
(1)作者經(jīng)驗(yàn)豐富:作者在機(jī)器視覺(jué)領(lǐng)域有豐富的實(shí)踐經(jīng)驗(yàn),獲得了大量專(zhuān)利,而且創(chuàng)辦了專(zhuān)門(mén)的機(jī)器視覺(jué)公司,將理論成果轉(zhuǎn)化為商業(yè)產(chǎn)品。
(2)零基礎(chǔ)快入門(mén):本書(shū)面向沒(méi)有機(jī)器視覺(jué)基礎(chǔ)的讀者,指導(dǎo)他們快速掌握人臉識(shí)別、人體動(dòng)作識(shí)別的技術(shù)、算法和應(yīng)用。
(3)結(jié)合行業(yè)熱點(diǎn):除了成熟的人臉識(shí)別和人體動(dòng)作識(shí)別的技術(shù)和算法外,本書(shū)還講解了行業(yè)里最新的、關(guān)注度極高的嵌入式設(shè)備、輕量級(jí)的人臉識(shí)別技術(shù)。
Preface
前 言
為什么要寫(xiě)這本書(shū)
隨著人們?cè)谌粘I钪袑?duì)智能化、便捷化、自動(dòng)化的需求日益提升,越來(lái)越多的人利用機(jī)器視覺(jué)技術(shù)對(duì)人臉、人體姿態(tài)進(jìn)行自動(dòng)化識(shí)別、判定。人臉識(shí)別技術(shù)可以用于快速確定用戶的身份,省去了很多人工處理的時(shí)間。人體姿態(tài)識(shí)別技術(shù)可以用于智能檢測(cè)人體骨架、姿態(tài)甚至動(dòng)作,目前廣泛應(yīng)用于姿態(tài)判斷、動(dòng)作糾正等
場(chǎng)景。
本書(shū)以人體自動(dòng)化、智能化識(shí)別為切入點(diǎn),講述機(jī)器視覺(jué)在應(yīng)用中的若干技術(shù),包括索引技術(shù)、人臉識(shí)別技術(shù)、人體姿態(tài)識(shí)別技術(shù),并結(jié)合實(shí)際應(yīng)用場(chǎng)景介紹這些技術(shù)的應(yīng)用案例。
人臉識(shí)別技術(shù)發(fā)展較早,是初級(jí)機(jī)器學(xué)習(xí)時(shí)代的產(chǎn)物,隨著深度學(xué)習(xí)技術(shù)的不斷深入,人臉識(shí)別技術(shù)迎來(lái)了發(fā)展機(jī)遇期,識(shí)別的精準(zhǔn)度顯著提升。當(dāng)前小型化、嵌入式人臉識(shí)別技術(shù)受到越來(lái)越多的關(guān)注。本書(shū)從小型化人臉識(shí)別技術(shù)出發(fā),由淺入深地闡述人臉識(shí)別技術(shù)。
人體姿態(tài)識(shí)別是近年來(lái)熱門(mén)的技術(shù),應(yīng)用較廣泛。縱觀技術(shù)現(xiàn)狀,人體姿態(tài)識(shí)別的精準(zhǔn)度還不夠高。本書(shū)所述技術(shù)為作者團(tuán)隊(duì)在實(shí)際研發(fā)中的經(jīng)驗(yàn)總結(jié),在應(yīng)用效果上優(yōu)于現(xiàn)有的大多數(shù)技術(shù)。
讀者對(duì)象
本書(shū)適合如下讀者閱讀。
機(jī)器視覺(jué)技術(shù)入門(mén)級(jí)讀者。
人臉識(shí)別技術(shù)研究和應(yīng)用的愛(ài)好者和開(kāi)發(fā)者。
高維索引技術(shù)研究和應(yīng)用的愛(ài)好者和開(kāi)發(fā)者。
人體姿態(tài)識(shí)別技術(shù)研究和應(yīng)用的愛(ài)好者和開(kāi)發(fā)者。
開(kāi)設(shè)相關(guān)課程的大專(zhuān)院校的師生。
本書(shū)特色
市面上介紹人臉識(shí)別技術(shù)的圖書(shū)較多,但沒(méi)有面向小型化設(shè)備的,并且大多數(shù)針對(duì)的是人臉識(shí)別技術(shù),介紹人體其他部位識(shí)別的有限。目前,人體識(shí)別技術(shù)的應(yīng)用場(chǎng)景日益增多,本書(shū)可以滿足一部分想了解人體識(shí)別技術(shù)的讀者的需求。
本書(shū)以作者所在技術(shù)團(tuán)隊(duì)在實(shí)際工作中的研發(fā)為基礎(chǔ),不僅講述人體智能識(shí)別的原理,還結(jié)合團(tuán)隊(duì)研發(fā)成果進(jìn)行深度剖析,并且結(jié)合不同應(yīng)用場(chǎng)景進(jìn)行人體智能識(shí)別的深入介紹。
如何閱讀本書(shū)
本書(shū)分為10章。
第1章主要介紹機(jī)器視覺(jué)的概念及其在人體識(shí)別中的相關(guān)應(yīng)用。
第2章主要介紹機(jī)器視覺(jué)中的索引技術(shù),包括概念與作用、向量空間索引技術(shù)和度量空間索引技術(shù)。
第3章主要介紹人臉識(shí)別技術(shù)、人臉檢測(cè)算法、人臉對(duì)齊算法、人臉特征提取算法的概念與分類(lèi)。
第4章主要介紹人體姿態(tài)識(shí)別技術(shù),包括自上而下的人體姿態(tài)識(shí)別技術(shù)和自下而上的人體姿態(tài)識(shí)別技術(shù)。
第5章主要介紹度量空間索引、相似性檢索、高維空間快速索引方法及高維空間快速索引實(shí)驗(yàn)。
第6章主要介紹嵌入式人臉識(shí)別裝置、輕量級(jí)人臉識(shí)別算法、嵌入式人臉識(shí)別應(yīng)用以及面向ARM的人臉精準(zhǔn)識(shí)別方法VMFace。
第7章主要介紹兩階段目標(biāo)檢測(cè)算法、一階段目標(biāo)檢測(cè)算法和算法性能測(cè)評(píng)。
第8章通過(guò)門(mén)禁場(chǎng)景和安防場(chǎng)景介紹嵌入式人臉設(shè)備的應(yīng)用。
第9章主要介紹人體姿態(tài)識(shí)別技術(shù)的應(yīng)用,包括運(yùn)動(dòng)訓(xùn)練場(chǎng)景、姿態(tài)糾正、安防、虛擬現(xiàn)實(shí)等。
第10章主要對(duì)機(jī)器視覺(jué)在人體識(shí)別領(lǐng)域中的關(guān)鍵問(wèn)題和挑戰(zhàn)進(jìn)行總結(jié),并展望未來(lái)發(fā)展。
勘誤和支持
由于作者的水平有限,書(shū)中難免會(huì)出現(xiàn)一些錯(cuò)誤或者不準(zhǔn)確的地方,懇請(qǐng)讀者批評(píng)指正。如果你有更多的寶貴意見(jiàn),也歡迎發(fā)送郵件至郵箱vm-info@visionmiracle.cn。期待能夠得到你們的真摯反饋。
致謝
著名劇作家蕭伯納曾說(shuō):人生最大的快樂(lè)是致力于一個(gè)自己認(rèn)為偉大的目標(biāo)。我熱衷于人工智能技術(shù),并將學(xué)習(xí)和實(shí)踐作為自己的目標(biāo),進(jìn)而從中獲得快樂(lè)。從我讀大學(xué)時(shí)首次接觸機(jī)器視覺(jué)技術(shù),到我將自己的認(rèn)知及實(shí)踐記錄成書(shū),十年間經(jīng)歷良多,姑且把本書(shū)看作自己這些年來(lái)在機(jī)器視覺(jué)領(lǐng)域的記錄和總結(jié)吧!
首先要感謝Geoffrey Hinton,他為我打開(kāi)了深度學(xué)習(xí)的一道門(mén)。
感謝肖思思和譚志鵬對(duì)本書(shū)整理和校對(duì)工作的支持。
感謝我的愛(ài)人胡艷艷及“崽崽”夏予、夏添,你們是我在面對(duì)困難時(shí)昂首向前的動(dòng)力。
感謝周波及視覺(jué)偉業(yè)的同事們,陪我一起推石頭上山般一點(diǎn)點(diǎn)地實(shí)踐人工智能。
感謝我的朋友們,你們總能給我提供建議、觀念以及建設(shè)性的意見(jiàn)。
謹(jǐn)以此書(shū)獻(xiàn)給眾多熱愛(ài)人工智能的朋友!
夏 東
夏 東
國(guó)防科技大學(xué)通信與信息系統(tǒng)博士、控制科學(xué)與工程博士后。長(zhǎng)期從事人工智能和自動(dòng)目標(biāo)識(shí)別領(lǐng)域的研究工作,主持完成國(guó)家“863計(jì)劃”項(xiàng)目等多個(gè)重大項(xiàng)目的研究,發(fā)明專(zhuān)利60余項(xiàng)。在機(jī)器智能視覺(jué)、大數(shù)據(jù)等領(lǐng)域有豐富的實(shí)戰(zhàn)經(jīng)驗(yàn)與深入的商業(yè)化理解。將機(jī)器智能視覺(jué)理論付諸實(shí)踐創(chuàng)立了湖南視覺(jué)偉業(yè)智能科技有限公司。作為湖南省科技創(chuàng)業(yè)領(lǐng)軍人才,帶領(lǐng)團(tuán)隊(duì)研發(fā)了人臉識(shí)別、行為分析等多款款業(yè)內(nèi)領(lǐng)先AI軟硬件產(chǎn)品,并在多個(gè)省份和城市得到應(yīng)用。
周 波
長(zhǎng)期從事計(jì)算機(jī)視覺(jué)、人工智能研究工作,發(fā)明專(zhuān)利40余項(xiàng),獲得“安防工匠人物”稱(chēng)號(hào),創(chuàng)立深圳市海清視訊科技有限公司,獲得國(guó)家級(jí)專(zhuān)精特新“小巨人”企業(yè)稱(chēng)號(hào)。
CONTENTS
目 錄
前言
第1章 機(jī)器視覺(jué)概述 1
1.1 機(jī)器視覺(jué)簡(jiǎn)介 1
1.1.1 什么是機(jī)器視覺(jué) 2
1.1.2 機(jī)器視覺(jué)的技術(shù)分類(lèi) 4
1.1.3 機(jī)器視覺(jué)技術(shù)的應(yīng)用與價(jià)值 14
1.2 機(jī)器視覺(jué)在人體識(shí)別中的相關(guān)應(yīng)用 19
1.2.1 人臉識(shí)別 19
1.2.2 人體姿態(tài)識(shí)別與估計(jì) 20
1.2.3 計(jì)算視覺(jué)小型化 22
1.2.4 意義與價(jià)值 23
1.3 本章小結(jié) 24
第2章 機(jī)器視覺(jué)中的索引技術(shù) 25
2.1 索引技術(shù)概述 25
2.1.1 索引的概念 26
2.1.2 索引的作用 27
2.2 向量空間索引技術(shù) 29
2.2.1 向量空間索引技術(shù)概述 29
2.2.2 分類(lèi)介紹 30
2.2.3 向量空間索引的應(yīng)用 42
2.3 度量空間索引技術(shù) 43
2.3.1 度量空間索引技術(shù)概述 43
2.3.2 分類(lèi)介紹 44
2.3.3 度量空間索引的應(yīng)用 49
2.4 本章小結(jié) 51
第3章 機(jī)器視覺(jué)中的人臉識(shí)別技術(shù) 52
3.1 人臉識(shí)別技術(shù) 52
3.1.1 概念與定義 52
3.1.2 人臉識(shí)別技術(shù)的分類(lèi) 57
3.2 人臉檢測(cè)算法 57
3.2.1 概念與定義 58
3.2.2 Adaboost 59
3.2.3 Cascade CNN 59
3.2.4 DenseBox 62
3.2.5 Faceness-Net 65
3.2.6 MTCNN 67
3.3 人臉對(duì)齊算法 69
3.3.1 概念與定義 69
3.3.2 DCNN 70
3.3.3 TCNN 72
3.3.4 LAB 73
3.4 人臉特征提取算法 74
3.4.1 概念與定義 75
3.4.2 DeepID 77
3.4.3 InsightFace 79
3.4.4 MobileFaceNet 80
3.5 本章小結(jié) 81
第4章 機(jī)器視覺(jué)中的人體姿態(tài)識(shí)別技術(shù) 82
4.1 人體姿態(tài)識(shí)別技術(shù)概述 82
4.1.1 概念與定義 83
4.1.2 人體姿態(tài)識(shí)別技術(shù)的特點(diǎn) 84
4.1.3 人體骨架關(guān)鍵點(diǎn)提取技術(shù) 85
4.1.4 人體姿態(tài)識(shí)別算法 87
4.2 自上而下的人體姿態(tài)識(shí)別技術(shù) 88
4.2.1 Mask R-CNN 88
4.2.2 RMPE 92
4.2.3 DeepCut 95
4.3 自下而上的人體姿態(tài)識(shí)別技術(shù) 97
4.3.1 PAF 97
4.3.2 Associative Embedding 99
4.4 本章小結(jié) 102
第5章 面向人臉檢索的高維空間快速索引技術(shù) 103
5.1 度量空間索引和相似性檢索 103
5.1.1 度量空間索引 104
5.1.2 相似性檢索 106
5.2 高維空間快速索引方法 109
5.2.1 度量空間索引快速查詢方法 109
5.2.2 度量空間索引KNN查詢方法 113
5.3 高維空間快速索引實(shí)驗(yàn) 117
5.3.1 實(shí)驗(yàn)環(huán)境 117
5.3.2 實(shí)驗(yàn)結(jié)果 117
5.3.3 分析比較 118
5.4 本章小結(jié) 119
第6章 嵌入式設(shè)備中的人臉精準(zhǔn)識(shí)別技術(shù) 120
6.1 嵌入式設(shè)備概述 120
6.1.1 嵌入式設(shè)備的由來(lái) 121
6.1.2 嵌入式設(shè)備的分類(lèi) 122
6.2 輕量級(jí)人臉識(shí)別算法與嵌入式人臉識(shí)別應(yīng)用 125
6.2.1 輕量級(jí)人臉識(shí)別算法 125
6.2.2 嵌入式人臉識(shí)別應(yīng)用 133
6.3 面向ARM的人臉精準(zhǔn)識(shí)別方法VMFace 135
6.3.1 VMFace神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 135
6.3.2 VMFace在ARM環(huán)境的應(yīng)用與性能分析 136
6.4 本章小結(jié) 139
第7章 面向姿態(tài)識(shí)別的目標(biāo)檢測(cè)算法與性能測(cè)評(píng) 140
7.1 兩階段目標(biāo)檢測(cè)算法 140
7.1.1 R-CNN模型 141
7.1.2 SPP-Net模型 148
7.1.3 Fast R-CNN模型 153
7.1.4 Faster R-CNN模型 157
7.2 一階段目標(biāo)檢測(cè)算法 160
7.2.1 YOLO模型 160
7.2.2 YOLO 2模型 162
7.2.3 SSD模型 165
7.3 算法性能測(cè)評(píng) 167
7.3.1 實(shí)驗(yàn)環(huán)境與參數(shù)設(shè)置 167
7.3.2 性能測(cè)試結(jié)果對(duì)比 169
7.4 本章小結(jié) 172
第8章 嵌入式人臉設(shè)備的應(yīng)用 173
8.1 門(mén)禁場(chǎng)景應(yīng)用 174
8.1.1 門(mén)禁場(chǎng)景應(yīng)用簡(jiǎn)介 175
8.1.2 人臉識(shí)別門(mén)禁場(chǎng)景體系設(shè)計(jì) 177
8.1.3 算法分析 178
8.1.4 案例介紹 179
8.2 安防場(chǎng)景應(yīng)用 182
8.2.1 人臉識(shí)別安防場(chǎng)景應(yīng)用簡(jiǎn)介 183
8.2.2 安防場(chǎng)景應(yīng)用結(jié)構(gòu) 184
8.2.3 案例介紹 187
8.3 本章小結(jié) 188
第9章 人體姿態(tài)識(shí)別技術(shù)的應(yīng)用 189
9.1 運(yùn)動(dòng)訓(xùn)練場(chǎng)景應(yīng)用 189
9.1.1 算法分析 190
9.1.2 案例介紹 191
9.2 姿態(tài)糾正應(yīng)用 193
9.2.1 坐姿糾正應(yīng)用 193
9.2.2 演講姿態(tài)糾正應(yīng)用 194
9.3 安防應(yīng)用 196
9.3.1 安防應(yīng)用背景 197
9.3.2 算法分析 197
9.4 虛擬現(xiàn)實(shí)應(yīng)用 198
9.4.1 虛擬現(xiàn)實(shí)應(yīng)用背景 198
9.4.2 算法分析 199
9.5 其他應(yīng)用場(chǎng)景 201
9.6 本章小結(jié) 202
第10章 問(wèn)題、挑戰(zhàn)與發(fā)展 203
10.1 問(wèn)題和挑戰(zhàn) 203
10.1.1 基礎(chǔ)性問(wèn)題和挑戰(zhàn) 203
10.1.2 技術(shù)挑戰(zhàn) 204
10.1.3 用戶隱私挑戰(zhàn) 205
10.2 未來(lái)發(fā)展 207
10.2.1 人臉識(shí)別技術(shù)的未來(lái) 208
10.2.2 人體姿態(tài)識(shí)別技術(shù)的未來(lái) 209
10.3 本章小結(jié) 210