機(jī)器人智能視覺(jué)感知與深度學(xué)習(xí)應(yīng)用
定 價(jià):89 元
叢書(shū)名:人工智能技術(shù)叢書(shū)
- 作者:梁橋康秦海項(xiàng)韶
- 出版時(shí)間:2023/7/1
- ISBN:9787111728726
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP181
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:
- 開(kāi)本:16開(kāi)
主要內(nèi)容包括基于深度學(xué)習(xí)的智能視覺(jué)感知技術(shù)概述、相機(jī)標(biāo)定、視覺(jué)目標(biāo)檢測(cè)、視覺(jué)目標(biāo)分割、視覺(jué)目標(biāo)跟蹤、行人重識(shí)別、人體姿態(tài)估計(jì)、智能噴碼檢測(cè)、智能表格識(shí)別、移動(dòng)機(jī)器人視覺(jué)感知系統(tǒng)、智能人機(jī)交互等。全書(shū)擬從理論到實(shí)際應(yīng)用,從算法分析到編程實(shí)現(xiàn)等多角度全方位介紹深度學(xué)習(xí)技術(shù)在智能視覺(jué)感知方面的研究,并深度結(jié)合了當(dāng)前國(guó)內(nèi)外最新研究熱點(diǎn),為業(yè)內(nèi)人士從事相關(guān)研究與應(yīng)用工作提供重要參考。
本書(shū)基于機(jī)器人視覺(jué)感知與控制技術(shù)國(guó)家工程研究中心多年的研究積累,從原理方法、算法開(kāi)發(fā)、模型搭建、實(shí)驗(yàn)驗(yàn)證和對(duì)比分析等方面概述了機(jī)器人視覺(jué)感知系統(tǒng)和深度學(xué)習(xí)技術(shù)。
前 言
智能人機(jī)協(xié)作機(jī)器人能自主適應(yīng)復(fù)雜動(dòng)態(tài)環(huán)境,并通過(guò)與作業(yè)環(huán)境/人/協(xié)作機(jī)器人自然交互,在共同工作空間通過(guò)近距離互動(dòng)完成更加復(fù)雜的作業(yè)任務(wù),因此受到了廣泛的重視。根據(jù)BlueWeave公司的市場(chǎng)分析報(bào)告,2021年全球協(xié)作機(jī)器人市場(chǎng)達(dá)到7.6億美元,到2028年,全球協(xié)作機(jī)器人市場(chǎng)增長(zhǎng)到39.9億美元。如何高效可靠地獲取和理解機(jī)器人與作業(yè)環(huán)境信息并有效交互是智能機(jī)器人實(shí)現(xiàn)合理的人機(jī)交互和智能操控的迫切需求。
機(jī)器人感知和智能是制約機(jī)器人技術(shù)發(fā)展與應(yīng)用的核心瓶頸,未知環(huán)境中的智能操作與自主作業(yè)很大程度上依靠對(duì)環(huán)境的認(rèn)識(shí)程度。雖然近年來(lái)作為機(jī)器人重要手段的視覺(jué)感知獲得了快速的發(fā)展,但機(jī)器人的整體感知水平和智能化程度還有待進(jìn)一步提升。此外,人工智能的迅速發(fā)展正深刻地改變著機(jī)器人視覺(jué)等信號(hào)的處理方式,國(guó)務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》指出:人工智能是引領(lǐng)未來(lái)的戰(zhàn)略性技術(shù),世界主要發(fā)達(dá)國(guó)家把發(fā)展人工智能作為提升國(guó)家競(jìng)爭(zhēng)力、維護(hù)國(guó)家安全的重大戰(zhàn)略。圖像及視頻等視覺(jué)處理技術(shù)作為人工智能下的一大技術(shù)領(lǐng)域,不僅可用于復(fù)雜、危險(xiǎn)場(chǎng)景下的視覺(jué)感知獲取,近年來(lái)還被廣泛應(yīng)用于防控預(yù)警、搶險(xiǎn)救災(zāi)和軍事領(lǐng)域,得到了世界各國(guó)的廣泛重視。
本書(shū)旨在深入介紹基于深度學(xué)習(xí)的機(jī)器人智能視覺(jué)感知技術(shù),為廣大工程技術(shù)人員學(xué)習(xí)視覺(jué)感知方面的應(yīng)用和最新理論方法奠定基礎(chǔ),同時(shí)也可作為高年級(jí)本科生、研究生或博士生的參考書(shū)。本書(shū)主要內(nèi)容包括機(jī)器人智能視覺(jué)感知系統(tǒng)概述、深度學(xué)習(xí)技術(shù)概述、自然場(chǎng)景下文本檢測(cè)與識(shí)別、視覺(jué)目標(biāo)檢測(cè)、多目標(biāo)跟蹤、圖像語(yǔ)義分割等。全書(shū)從方法到實(shí)際應(yīng)用,從算法分析到模型搭建等多角度介紹深度學(xué)習(xí)技術(shù)在智能視覺(jué)感知方面的研究,并深度結(jié)合了當(dāng)前國(guó)內(nèi)外最新研究熱點(diǎn),為業(yè)內(nèi)人士從事相關(guān)研究與應(yīng)用工作提供重要參考。
本書(shū)基于團(tuán)隊(duì)多項(xiàng)機(jī)器人感知與控制技術(shù)相關(guān)的國(guó)家級(jí)項(xiàng)目(2021YFC1910402,NSFC. 62073129、NSFC.U21A20490、NSFC.61673163、湖南省自然科學(xué)基金–杰出青年基金項(xiàng)目2022JJ10020國(guó)家重點(diǎn)研發(fā)計(jì)劃)、湖南省科技計(jì)劃項(xiàng)目(2020GK2025)、深圳科技計(jì)劃項(xiàng)目 (2021Szvup035)的研究成果,聚焦機(jī)器人視覺(jué)感知前沿和國(guó)家戰(zhàn)略需求,從應(yīng)用背景、需求分析、原理方法、算法開(kāi)發(fā)、模型搭建、實(shí)驗(yàn)驗(yàn)證、對(duì)比分析等方面展開(kāi)論述。全書(shū)共分為7章:第1章概述了機(jī)器人視覺(jué)感知系統(tǒng)的發(fā)展和挑戰(zhàn);第2章對(duì)機(jī)器人智能視覺(jué)感知系統(tǒng)的組成、主要實(shí)現(xiàn)步驟和典型應(yīng)用進(jìn)行了闡述;第3章對(duì)機(jī)器人視覺(jué)感知系統(tǒng)廣泛應(yīng)用的深度學(xué)習(xí)技術(shù)進(jìn)行了概述;第4章簡(jiǎn)述了自然場(chǎng)景下基于圖像分割的文本檢測(cè)和基于序列的場(chǎng)景文本識(shí)別技術(shù);第5章闡述了視覺(jué)目標(biāo)檢測(cè)技術(shù),重點(diǎn)描述了基于R-FCN的目標(biāo)檢測(cè)和基于Mask RCNN的目標(biāo)檢測(cè)方法;第6章簡(jiǎn)述了多目標(biāo)跟蹤技術(shù),重點(diǎn)闡述了基于序列特征的多目標(biāo)跟蹤方法和基于上下文圖模型的多目標(biāo)跟蹤方法;第7章簡(jiǎn)述了圖像分割方法,重點(diǎn)描述了基于自適應(yīng)特征選擇網(wǎng)絡(luò)的遙感影像語(yǔ)義分割方法和基于SU-SWA的區(qū)域分割方法。
在本書(shū)的核心內(nèi)容準(zhǔn)備過(guò)程中,團(tuán)隊(duì)的梁橋康、譚艾琳、郭東妮負(fù)責(zé)了機(jī)器人視覺(jué)感知系統(tǒng)和深度學(xué)習(xí)技術(shù)概述的相關(guān)內(nèi)容;朱為、葛俏、彭建忠負(fù)責(zé)了噴碼識(shí)別系統(tǒng)的相關(guān)內(nèi)容;項(xiàng)韶、金晶負(fù)責(zé)了自然場(chǎng)景下文本檢測(cè)與識(shí)別的相關(guān)內(nèi)容;梅麗、伍萬(wàn)能負(fù)責(zé)了視覺(jué)目標(biāo)檢測(cè)的相關(guān)內(nèi)容;譚旭、伍萬(wàn)能負(fù)責(zé)了多目標(biāo)跟蹤的相關(guān)內(nèi)容;項(xiàng)韶、梁橋康負(fù)責(zé)了機(jī)器人視覺(jué)感知系統(tǒng)的典型應(yīng)用的相關(guān)內(nèi)容;南洋、湯鵬、項(xiàng)韶、秦海負(fù)責(zé)了圖像語(yǔ)義分割的相關(guān)內(nèi)容;梁橋康、鄒坤霖、鄧淞允、謝冰冰等為對(duì)比實(shí)驗(yàn)和網(wǎng)絡(luò)框架等做出了貢獻(xiàn);梁橋康、秦海負(fù)責(zé)統(tǒng)稿。
本書(shū)適合機(jī)器人視覺(jué)感知技術(shù)的初學(xué)者或愛(ài)好者閱讀,也非常適合機(jī)器人感知、深度學(xué)習(xí)、人工智能等相關(guān)從業(yè)者參考。希望讀者在閱讀完本書(shū)后能根據(jù)實(shí)際的應(yīng)用場(chǎng)景需求搭建對(duì)應(yīng)的智能機(jī)器人視覺(jué)感知系統(tǒng),為提升我國(guó)機(jī)器人核心感知技術(shù)創(chuàng)新水平貢獻(xiàn)自己的力量。
本書(shū)受到國(guó)家自然科學(xué)基金項(xiàng)目(NSFC.62073129、NSFC.U21A20490)、國(guó)家重點(diǎn)研發(fā)計(jì)劃(2021YFC1910402)和湖南省自然科學(xué)基金–杰出青年基金項(xiàng)目(2022JJ10020)的資助,特此感謝。最后特別感謝機(jī)械工業(yè)出版社編輯們對(duì)本書(shū)出版的大力支持。
作者
湖南大學(xué)機(jī)器人視覺(jué)感知與控制技術(shù)國(guó)家工程研究中心
2023年1月
目 錄
推薦序
前言
第1章 緒論 1
1.1 機(jī)器人視覺(jué)感知系統(tǒng) 2
1.2 機(jī)器人視覺(jué)感知發(fā)展趨勢(shì) 2
1.3 機(jī)器人視覺(jué)感知研究挑戰(zhàn) 3
1.4 噴碼識(shí)別系統(tǒng)應(yīng)用實(shí)踐 8
1.4.1 噴碼檢測(cè)方法概述 9
1.4.2 噴碼識(shí)別系統(tǒng)需求分析 11
1.4.3 噴碼識(shí)別系統(tǒng)硬件選型 12
1.4.4 基于輕量級(jí)Ghost-YOLO
模型的噴碼識(shí)別 16
1.5 本章小結(jié) 30
第2章 機(jī)器人智能視覺(jué)感知系統(tǒng)
概述 31
2.1 機(jī)器人智能視覺(jué)感知系統(tǒng)組成 31
2.2 機(jī)器人智能視覺(jué)感知的主要
流程 37
2.3 機(jī)器人智能視覺(jué)感知的典型
應(yīng)用 39
2.3.1 面向農(nóng)業(yè)機(jī)器人的視覺(jué)感知概述 40
2.3.2 基于多模型融合的應(yīng)用
實(shí)踐 41
2.4 本章小結(jié) 49
第3章 深度學(xué)習(xí)技術(shù)概述 50
3.1 全連接神經(jīng)網(wǎng)絡(luò) 50
3.1.1 反向傳播原理 52
3.1.2 全連接神經(jīng)網(wǎng)絡(luò)的缺點(diǎn) 53
3.2 卷積神經(jīng)網(wǎng)絡(luò)及其應(yīng)用 53
3.2.1 神經(jīng)網(wǎng)絡(luò)的基本運(yùn)算 54
3.2.2 神經(jīng)網(wǎng)絡(luò)的常用函數(shù) 58
3.2.3 模型融合 64
3.2.4 循環(huán)神經(jīng)網(wǎng)絡(luò) 66
3.2.5 集成學(xué)習(xí)理論基礎(chǔ) 69
3.3 基于深度學(xué)習(xí)的視覺(jué)目標(biāo)檢測(cè) 70
3.3.1 兩階段算法 71
3.3.2 一階段算法 71
3.4 基于深度學(xué)習(xí)的視覺(jué)目標(biāo)跟蹤 73
3.4.1 單目標(biāo)跟蹤 73
3.4.2 多目標(biāo)跟蹤 74
3.5 本章小結(jié) 75
第4章 自然場(chǎng)景下文本檢測(cè)與
識(shí)別 76
4.1 概述 76
4.2 基于圖像分割的場(chǎng)景文本檢測(cè) 81
4.2.1 特征提取網(wǎng)絡(luò) 82
4.2.2 文本區(qū)域掩碼標(biāo)簽的
生成 83
4.2.3 場(chǎng)景文本區(qū)域的檢測(cè) 84
4.2.4 文本區(qū)域的后處理算法 85
4.2.5 文本檢測(cè)應(yīng)用實(shí)踐 87
4.3 基于序列的場(chǎng)景文本識(shí)別 92
4.3.1 場(chǎng)景文本特征序列的
提取 93
4.3.2 特征序列上下文信息
提取 95
4.3.3 轉(zhuǎn)錄層文本識(shí)別 98
4.3.4 文本識(shí)別網(wǎng)絡(luò) 100
4.3.5 模型訓(xùn)練 101
4.3.6 文本識(shí)別應(yīng)用實(shí)踐 102
4.4 基于輕量級(jí)模型的噴碼文本識(shí)別
系統(tǒng) 106
4.4.1 字符區(qū)域提取 107
4.4.2 字符文本處理 108
4.4.3 字符文本識(shí)別 109
4.4.4 字符文本識(shí)別應(yīng)用實(shí)踐 115
4.4.5 基于嵌入式系統(tǒng)的算法
設(shè)計(jì)與實(shí)現(xiàn) 121
4.4.6 系統(tǒng)運(yùn)行測(cè)試 124
4.5 本章小結(jié) 125
第5章 視覺(jué)目標(biāo)檢測(cè) 126
5.1 目標(biāo)檢測(cè)系統(tǒng)概述 126
5.2 目標(biāo)檢測(cè)的相關(guān)概念 129
5.3 目標(biāo)檢測(cè)模型分類 133
5.4 數(shù)據(jù)獲取與處理 135
5.4.1 數(shù)據(jù)預(yù)處理 136
5.4.2 數(shù)據(jù)標(biāo)注 138
5.5 基于R-FCN的目標(biāo)檢測(cè) 140
5.5.1 R-FCN基本原理介紹 140
5.5.2 R-FCN算法的改進(jìn) 146
5.5.3 目標(biāo)檢測(cè)應(yīng)用實(shí)踐 150
5.6 基于Mask R-CNN的目標(biāo)檢測(cè) 153
5.6.1 Mask R-CNN算法基本
原理 154
5.6.2 改進(jìn)Mask R-CNN模型 157
5.6.3 Mask R-CNN應(yīng)用實(shí)踐 162
5.6.4 籃球以及球員檢測(cè)系統(tǒng)
軟件設(shè)計(jì) 164
5.7 本章小結(jié) 167
第6章 多目標(biāo)跟蹤 168
6.1 目標(biāo)跟蹤概述 168
6.1.1 單目標(biāo)跟蹤 168
6.1.2 多目標(biāo)跟蹤 171
6.1.3 多相機(jī)多目標(biāo)跟蹤 175
6.2 多目標(biāo)跟蹤系統(tǒng)構(gòu)成 176
6.3 基于序列特征的多目標(biāo)跟蹤
方法 177
6.4 基于上下文圖模型的單相機(jī)多目標(biāo)
跟蹤 184
6.4.1 圖卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)
知識(shí) 186
6.4.2 基于上下文圖模型的單相機(jī)多球員跟蹤 187
6.4.3 多目標(biāo)跟蹤應(yīng)用實(shí)踐 193
6.5 本章小結(jié) 199
第7章 圖像語(yǔ)義分割 200
7.1 圖像語(yǔ)義分割概述 200
7.1.1 圖像分割算法的定義 200
7.1.2 傳統(tǒng)的圖像分割算法 200
7.1.3 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像
語(yǔ)義分割算法 204
7.2 基于自適應(yīng)特征選擇網(wǎng)絡(luò)的遙感
影像語(yǔ)義分割 208
7.2.1 基于自適應(yīng)特征選擇
網(wǎng)絡(luò)的遙感影像語(yǔ)義分割
算法 208
7.2.2 基于自適應(yīng)特征選擇網(wǎng)絡(luò)的遙感影像分割應(yīng)用實(shí)踐 211
7.3 基于SU-SWA的區(qū)域分割 215
7.3.1 基于SU-SWA的區(qū)域分割
任務(wù)分析 215
7.3.2 基于SU-SWA的區(qū)域分割
方法 215
7.3.3 基于SU-SWA的區(qū)域分割
應(yīng)用實(shí)踐 219
7.4 本章小結(jié) 229
參考文獻(xiàn) 230