Python計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理 開(kāi)發(fā)機(jī)器人應(yīng)用系統(tǒng)
定 價(jià):89.9 元
叢書(shū)名:計(jì)算機(jī)視覺(jué)
- 作者:[西]阿爾瓦羅·莫雷納·阿爾貝羅拉(álvaro Morena Alberola) [西]貢薩洛·莫利納·加列戈(Gonzalo Molina Gallego) [西]烏奈·加
- 出版時(shí)間:2021/6/1
- ISBN:9787115560629
- 出 版 社:人民郵電出版社
- 中圖法分類(lèi):TP311.56
- 頁(yè)碼:254
- 紙張:
- 版次:01
- 開(kāi)本:16開(kāi)
機(jī)器人是人工智能時(shí)代的重要產(chǎn)物,為人類(lèi)的工作和生活提供了非常多的助力。對(duì)于智能機(jī)器人而言,視覺(jué)識(shí)別能力和對(duì)話能力是非常重要的兩個(gè)方面,本書(shū)就是基于這兩個(gè)技術(shù)展開(kāi)介紹,并通過(guò)一系列的編程案例和實(shí)踐項(xiàng)目,引導(dǎo)讀者高效掌握機(jī)器人的開(kāi)發(fā)技巧。
本書(shū)基于Python語(yǔ)言進(jìn)行講解,結(jié)合機(jī)器人操作系統(tǒng)(ROS)平臺(tái)給出了豐富多樣的機(jī)器人開(kāi)發(fā)方案。本書(shū)立足于機(jī)器人的視覺(jué)和語(yǔ)言處理,通過(guò)OpenCV、自然語(yǔ)言處理、循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等技術(shù)提高機(jī)器人的視覺(jué)識(shí)別能力和對(duì)話能力。全書(shū)包括多個(gè)練習(xí)和項(xiàng)目,通過(guò)知識(shí)點(diǎn)和編程實(shí)踐相結(jié)合的方式,快速帶領(lǐng)讀者掌握實(shí)用的機(jī)器人開(kāi)發(fā)技術(shù)。
本書(shū)適合機(jī)器人或智能軟硬件研發(fā)領(lǐng)域的工程師閱讀,也適合高校人工智能相關(guān)專(zhuān)業(yè)的師生閱讀。
1.技術(shù)點(diǎn)熱:用Python講解自然語(yǔ)言處理技術(shù)和計(jì)算機(jī)視覺(jué)技術(shù);;
2.作者知名:多名作者聯(lián)合編寫(xiě),繼承了AI在機(jī)器人領(lǐng)域應(yīng)用的權(quán)威經(jīng)驗(yàn);
3.內(nèi)容豐富:用ROS開(kāi)發(fā)更智能的機(jī)器人系統(tǒng),用NLP技術(shù)和OpenCV技術(shù)讓機(jī)器人更加智能;
4.立足實(shí)踐:書(shū)中包含大量練習(xí)與項(xiàng)目,幫助讀者快速掌握機(jī)器人開(kāi)發(fā)技術(shù),全方位提升讀者的動(dòng)手能力和研發(fā)能力。
5.配套資源:配套的代碼資源包和彩色圖片包,讓你邊學(xué)邊對(duì)照,學(xué)習(xí)效率更高。
阿爾瓦羅·莫雷納·阿爾貝羅拉(álvaro Morena Alberola)是一名熱愛(ài)機(jī)器人學(xué)和人工智能的計(jì)算機(jī)工程師,目前從事軟件開(kāi)發(fā)工作。álvaro對(duì)基于人工視覺(jué)的人工智能(AI)核心部分非常感興趣,并且喜歡嘗試新技術(shù)和先進(jìn)的工具。對(duì)他來(lái)說(shuō),機(jī)器人可以讓人類(lèi)的生活更輕松,并且可以幫助人們完成他們自己無(wú)法完成的任務(wù)。
貢薩洛·莫利納·加列戈(Gonzalo Molina Gallego)是一名計(jì)算機(jī)科學(xué)專(zhuān)業(yè)的碩士,主修人工智能和自然語(yǔ)言處理。他構(gòu)建過(guò)基于文本的對(duì)話系統(tǒng)和對(duì)話代理,擅長(zhǎng)提供方法論層面的建議。目前,他致力于研究跨領(lǐng)域?qū)υ捪到y(tǒng)方向的新技術(shù)。Gonzalo認(rèn)為,未來(lái)的用戶界面是基于對(duì)話的。
烏奈·加雷·馬埃斯特雷(Unai Garay Maestre)是一名計(jì)算機(jī)科學(xué)專(zhuān)業(yè)的碩士,主修人工智能和計(jì)算機(jī)視覺(jué)。在為2018年的CIARP大會(huì)貢獻(xiàn)的一篇論文中,他提出了一種使用變分自編碼器進(jìn)行數(shù)據(jù)增強(qiáng)的新方法。他同時(shí)是一名機(jī)器學(xué)習(xí)工程師,使用深度神經(jīng)網(wǎng)絡(luò)處理圖像。
第 1章 機(jī)器人學(xué)基礎(chǔ) 1
1.1 簡(jiǎn)介 1
1.2 機(jī)器人學(xué)的歷史 2
1.3 人工智能 3
1.3.1 自然語(yǔ)言處理簡(jiǎn)介 4
1.3.2 計(jì)算機(jī)視覺(jué)簡(jiǎn)介 5
1.3.3 機(jī)器人的類(lèi)型 5
1.3.4 機(jī)器人的硬件和軟件 6
1.4 機(jī)器人定位 8
1.4.1 練習(xí)1:計(jì)算機(jī)器人的位置 10
1.4.2 如何進(jìn)行機(jī)器人開(kāi)發(fā) 12
1.4.3 練習(xí)2:使用Python計(jì)算輪子走過(guò)的距離 12
1.4.4 練習(xí)3:使用Python計(jì)算機(jī)器人的最終位置 13
1.4.5 項(xiàng)目1:使用Python和測(cè)距法進(jìn)行機(jī)器人定位 15
1.5 小結(jié) 16
第 2章 計(jì)算機(jī)視覺(jué) 17
2.1 簡(jiǎn)介 17
2.2 計(jì)算機(jī)視覺(jué)基本算法 18
2.2.1 圖像相關(guān)術(shù)語(yǔ) 18
2.2.2 OpenCV 19
2.2.3 閾值化 19
2.2.4 練習(xí)4:對(duì)圖像應(yīng)用各種閾值化操作 21
2.2.5 形態(tài)學(xué)變換 25
2.2.6 練習(xí)5:對(duì)圖像應(yīng)用形態(tài)學(xué)變換 27
2.2.7 模糊(平滑) 31
2.2.8 練習(xí)6:對(duì)圖像應(yīng)用模糊方法 32
2.2.9 練習(xí)7:加載圖像并應(yīng)用所學(xué)的各種方法 34
2.3 機(jī)器學(xué)習(xí)簡(jiǎn)介 38
2.3.1 決策樹(shù)和提升方法 38
2.3.2 練習(xí)8:使用決策樹(shù)、隨機(jī)森林和AdaBoost進(jìn)行數(shù)字
預(yù)測(cè) 41
2.3.3 人工神經(jīng)網(wǎng)絡(luò) 47
2.3.4 練習(xí)9:構(gòu)建第 一個(gè)神經(jīng)網(wǎng)絡(luò) 51
2.3.5 項(xiàng)目2:對(duì)Fashion-MNIST數(shù)據(jù)集中的10種衣物進(jìn)行分類(lèi) 54
2.4 小結(jié) 56
第3章 自然語(yǔ)言處理 57
3.1 簡(jiǎn)介 57
3.1.1 自然語(yǔ)言處理 58
3.1.2 自然語(yǔ)言處理的兩個(gè)部分 59
3.1.3 NLP的各層次 60
3.2 Python中的NLP 61
3.2.1 自然語(yǔ)言工具包(NLTK) 61
3.2.2 練習(xí)10:NLTK入門(mén) 62
3.2.3 spaCy 65
3.2.4 練習(xí)11:spaCy入門(mén) 67
3.3 主題建!70
3.3.1 詞頻-逆文檔頻率(TF-IDF) 70
3.3.2 潛在語(yǔ)義分析(LSA) 71
3.3.3 練習(xí)12:使用Python進(jìn)行主題建!72
3.3.4 項(xiàng)目3:處理一個(gè)語(yǔ)料庫(kù) 75
3.4 語(yǔ)言建!76
3.4.1 語(yǔ)言模型簡(jiǎn)介 76
3.4.2 二元模型 77
3.4.3 N元模型 77
3.4.4 計(jì)算概率 78
3.4.5 練習(xí)13:創(chuàng)建一個(gè)二元模型 80
3.5 小結(jié) 83
第4章 NLP神經(jīng)網(wǎng)絡(luò) 84
4.1 簡(jiǎn)介 84
4.2 循環(huán)神經(jīng)網(wǎng)絡(luò) 86
4.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)簡(jiǎn)介 87
4.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)原理 87
4.2.3 RNN架構(gòu) 89
4.2.4 長(zhǎng)距離依賴(lài)問(wèn)題 89
4.2.5 練習(xí)14:使用RNN預(yù)測(cè)房?jī)r(jià) 90
4.2.6 長(zhǎng)短期記憶網(wǎng)絡(luò) 93
4.2.7 練習(xí)15:預(yù)測(cè)數(shù)學(xué)函數(shù)的下一個(gè)解 94
4.3 神經(jīng)語(yǔ)言模型 100
4.3.1 神經(jīng)語(yǔ)言模型簡(jiǎn)介 100
4.3.2 RNN語(yǔ)言模型 102
4.3.3 練習(xí)16:對(duì)一個(gè)小語(yǔ)料庫(kù)進(jìn)行編碼 103
4.3.4 RNN的輸入維度 107
4.3.5 項(xiàng)目4:預(yù)測(cè)字符序列中的下一個(gè)字符 109
4.4 小結(jié) 111
第5章 計(jì)算機(jī)視覺(jué)中的卷積神經(jīng)網(wǎng)絡(luò) 112
5.1 簡(jiǎn)介 112
5.2 CNN基礎(chǔ) 113
5.3 構(gòu)建第 一個(gè)CNN 118
練習(xí)17:構(gòu)建一個(gè)CNN 119
5.4 改進(jìn)模型的方法:數(shù)據(jù)增強(qiáng) 124
5.4.1 練習(xí)18:利用數(shù)據(jù)增強(qiáng)改進(jìn)模型 125
5.4.2 項(xiàng)目5:使用數(shù)據(jù)增強(qiáng)來(lái)正確對(duì)花朵圖像進(jìn)行分類(lèi) 134
5.5 最先進(jìn)的模型:遷移學(xué)習(xí) 137
練習(xí)19:基于遷移學(xué)習(xí)對(duì)鈔票進(jìn)行分類(lèi) 139
5.6 小結(jié) 144
第6章 機(jī)器人操作系統(tǒng)(ROS) 146
6.1 簡(jiǎn)介 146
6.2 ROS基本概念 147
6.3 ROS基本命令 148
6.4 安裝和配置 149
6.5 Catkin工作空間和軟件包 149
6.6 發(fā)布者和訂閱者 150
6.6.1 練習(xí)20:編寫(xiě)簡(jiǎn)單的發(fā)布者和訂閱者 151
6.6.2 練習(xí)21:編寫(xiě)較復(fù)雜的發(fā)布者和訂閱者 154
6.7 模擬器 159
6.7.1 練習(xí)22:Turtlebot配置 159
6.7.2 練習(xí)23:模擬器和傳感器 161
6.7.3 項(xiàng)目6:模擬器和傳感器 163
6.8 小結(jié) 164
第7章 構(gòu)建基于文本的對(duì)話系統(tǒng)(聊天機(jī)器人) 165
7.1 簡(jiǎn)介 165
7.2 向量空間中的詞表示 166
7.2.1 詞嵌入 166
7.2.2 余弦相似度 167
7.2.3 Word2Vec 168
7.2.4 Word2Vec的問(wèn)題 169
7.2.5 Gensim 169
7.2.6 練習(xí)24:創(chuàng)建詞嵌入 169
7.2.7 全局向量(GloVe) 173
7.2.8 練習(xí)25:使用預(yù)訓(xùn)練的GloVe模型觀察詞語(yǔ)在平面上的分布 174
7.3 對(duì)話系統(tǒng) 179
7.3.1 聊天機(jī)器人的開(kāi)發(fā)工具 180
7.3.2 對(duì)話代理的類(lèi)型 180
7.3.3 創(chuàng)建基于文本的對(duì)話系統(tǒng) 182
7.3.4 練習(xí)26:創(chuàng)建第 一個(gè)對(duì)話代理 184
7.3.5 項(xiàng)目7:創(chuàng)建一個(gè)用來(lái)控制機(jī)器人的對(duì)話代理 189
7.4 小結(jié) 191
第8章 利用基于CNN的物體識(shí)別來(lái)指導(dǎo)機(jī)器人 193
8.1 簡(jiǎn)介 193
8.2 多物體識(shí)別和檢測(cè) 194
8.2.1 練習(xí)27:構(gòu)建第 一個(gè)多物體檢測(cè)和識(shí)別系統(tǒng) 195
8.2.2 ImageAI 200
8.3 視頻中的多物體識(shí)別和檢測(cè) 202
項(xiàng)目8:視頻中的多物體檢測(cè)和識(shí)別 206
8.4 小結(jié) 206
第9章 機(jī)器人的計(jì)算機(jī)視覺(jué) 208
9.1 簡(jiǎn)介 208
9.2 Darknet 209
Darknet基礎(chǔ)安裝 209
9.3 YOLO 210
9.3.1 使用YOLO進(jìn)行預(yù)測(cè) 211
9.3.2 在攝像頭上使用YOLO 215
9.3.3 練習(xí)28:YOLO編程 215
9.3.4 練習(xí)29:在ROS中集成YOLO 219
9.3.5 項(xiàng)目9:機(jī)器人保安 223
9.4 小結(jié) 224
附錄 本書(shū)項(xiàng)目概覽 225