機(jī)器視覺(jué)的開(kāi)發(fā)實(shí)踐
定 價(jià):59 元
- 作者:邢萌,陳財(cái)森,畢建權(quán)編
- 出版時(shí)間:2022/12/1
- ISBN:9787566137555
- 出 版 社:哈爾濱工程大學(xué)出版社
- 中圖法分類(lèi):TP302.7
- 頁(yè)碼:191
- 紙張:膠版紙
- 版次:1
- 開(kāi)本:16開(kāi)
《機(jī)器視覺(jué)的開(kāi)發(fā)實(shí)踐》著力于介紹機(jī)器視覺(jué)的基本理論、架構(gòu)和主要技術(shù)等,利用深度學(xué)習(xí)常見(jiàn)框架TensorFlow等,創(chuàng)建強(qiáng)大的圖像處理應(yīng)用程序,并給出了具體的開(kāi)發(fā)實(shí)踐。
《機(jī)器視覺(jué)的開(kāi)發(fā)實(shí)踐》主要內(nèi)容包括機(jī)器視覺(jué)基礎(chǔ),神經(jīng)網(wǎng)絡(luò)與機(jī)器視覺(jué),機(jī)器學(xué)習(xí)開(kāi)發(fā)實(shí)踐環(huán)境,圖像分類(lèi)、分割、生成和目標(biāo)檢測(cè)等,給出了機(jī)器視覺(jué)高級(jí)概念和新前沿,為機(jī)器視覺(jué)研究領(lǐng)域提供了良好的理論指導(dǎo)和技術(shù)支撐。
《機(jī)器視覺(jué)的開(kāi)發(fā)實(shí)踐》可供從事機(jī)器視覺(jué)方面的工程技術(shù)人員參考閱讀。
本書(shū)從機(jī)器視覺(jué)和深度學(xué)習(xí)的基礎(chǔ)概念入手,以流行的深度學(xué)習(xí)框架PyTorch為基礎(chǔ),展示深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)方面的應(yīng)用。作為機(jī)器視覺(jué)的入門(mén)和實(shí)戰(zhàn)教程,本書(shū)以簡(jiǎn)潔易懂的語(yǔ)言和示例介紹相關(guān)機(jī)器視覺(jué)和深度學(xué)習(xí)的理論知識(shí),并介紹如何更好地使用PyTorch深度學(xué)習(xí)框架來(lái)處理機(jī)器視覺(jué)方面的問(wèn)題。
本書(shū)共7章,主要內(nèi)容如下:
第1章機(jī)器視覺(jué)基礎(chǔ)。本章介紹了有關(guān)機(jī)器視覺(jué)的基礎(chǔ)知識(shí),包括機(jī)器視覺(jué)的概念、發(fā)展和應(yīng)用,分析了機(jī)器視覺(jué)的任務(wù),研究了機(jī)器視覺(jué)的構(gòu)成及各組成部分的主要功能,并從圖像噪聲、圖像濾波、幾何變換和圖像特征四個(gè)方面深入分析了機(jī)器視覺(jué)的原理,為后續(xù)相關(guān)內(nèi)容的研究奠定了基礎(chǔ)。
第2章神經(jīng)網(wǎng)絡(luò)與機(jī)器視覺(jué)。本章介紹了神經(jīng)網(wǎng)絡(luò)基礎(chǔ)、卷積神經(jīng)網(wǎng)絡(luò)、典型CNN架構(gòu)模型及常見(jiàn)深度學(xué)習(xí)框架。其中,典型CNN架構(gòu)模型包括LeNet-5、AlexNet、GoogleNet、VGGNet、ResNet等;常見(jiàn)的深度學(xué)習(xí)框架包括TensorFlow、PyTorch、Keras、Caffe、CNTK、MXNet等。
第3章機(jī)器學(xué)習(xí)開(kāi)發(fā)實(shí)踐環(huán)境。本章首先介紹了機(jī)器學(xué)習(xí)開(kāi)發(fā)所用到的實(shí)踐環(huán)境,包括Anaconda開(kāi)發(fā)平臺(tái)的基礎(chǔ)知識(shí)及其安裝方法,以及嵌入式機(jī)器視覺(jué)開(kāi)發(fā)平臺(tái)及其相關(guān)技術(shù);其次介紹了如何安裝Anaconda,以及在Anaconda環(huán)境下安裝TensorFlow和PyTorch框架的方法;最后介紹了機(jī)器視覺(jué)開(kāi)發(fā)常用的幾種數(shù)據(jù)集,并給出了示例。
第4章圖像分類(lèi)開(kāi)發(fā)實(shí)踐。本章主要介紹了圖像分類(lèi)基本概念及原理、典型分類(lèi)模型和圖像分類(lèi)的軟硬件開(kāi)發(fā)環(huán)境,并通過(guò)實(shí)戰(zhàn)的方式對(duì)圖像分類(lèi)進(jìn)行了介紹,包括數(shù)據(jù)預(yù)處理、模型搭建、訓(xùn)練及最后的驗(yàn)證。
第5章目標(biāo)檢測(cè)開(kāi)發(fā)實(shí)踐。本章首先從目標(biāo)檢測(cè)任務(wù)的需求出發(fā),對(duì)目標(biāo)檢測(cè)的性能指標(biāo)做了介紹;其次介紹了傳統(tǒng)的基于特征的目標(biāo)檢測(cè)算法模型及利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行目標(biāo)檢測(cè)算法模型,著重介紹了YOLO模型及原理,特別是算法的訓(xùn)練與預(yù)測(cè)中的具體細(xì)節(jié);最后給出了如何使用PyTorch實(shí)現(xiàn)YOLOv5算法。
第6章圖像分割開(kāi)發(fā)實(shí)踐。本章首先介紹了圖像分割的基本概念,包括圖像分割的內(nèi)容、類(lèi)別及目的;其次介紹了基于閾值、區(qū)域、邊緣檢測(cè)等的常見(jiàn)傳統(tǒng)圖像分割方法,包括基本思想和具體程序?qū)崿F(xiàn);最后介紹了當(dāng)前基于深度學(xué)習(xí)的核心思想和常用數(shù)據(jù)集,分析了經(jīng)典分割框架FCN的基本原理,在此基礎(chǔ)上介紹其改進(jìn)后提出的UNet方法,并在介紹相關(guān)算法基本原理的基礎(chǔ)上,給出了主要實(shí)驗(yàn)過(guò)程和關(guān)鍵代碼以供參考。
第7章圖像生成技術(shù)。圖像生成領(lǐng)域內(nèi)主流的圖像生成技術(shù)有三類(lèi),分別是PixelCNN像素卷積網(wǎng)絡(luò)、VAE變分自編碼器和GAN生成對(duì)抗網(wǎng)絡(luò)。本章選擇了最近熱門(mén)的GAN生成對(duì)抗網(wǎng)絡(luò)作為主要內(nèi)容,重點(diǎn)介紹了生成對(duì)抗網(wǎng)絡(luò)思想及算法推導(dǎo),利用PyTorch實(shí)現(xiàn)了WGAN算法,并利用不同的數(shù)據(jù)集來(lái)生成圖像。
本書(shū)可為機(jī)器視覺(jué)研究領(lǐng)域提供良好的理論指導(dǎo)和技術(shù)支撐,進(jìn)一步地,讀者可結(jié)合典型應(yīng)用場(chǎng)景,依據(jù)本書(shū)提供的經(jīng)典案例和代碼,開(kāi)展具體實(shí)踐驗(yàn)證。編者結(jié)合多年在機(jī)器視覺(jué)方面的科研與教學(xué)經(jīng)驗(yàn),參考國(guó)內(nèi)外最新研究成果,總結(jié)并編寫(xiě)本書(shū),希望對(duì)讀者有所幫助。
第1章 機(jī)器視覺(jué)基礎(chǔ)
1.1 機(jī)器視覺(jué)概述
1.2 機(jī)器視覺(jué)系統(tǒng)的任務(wù)
1.3 機(jī)器視覺(jué)系統(tǒng)的構(gòu)成
1.4 機(jī)器視覺(jué)原理
第2章 神經(jīng)網(wǎng)絡(luò)與機(jī)器視覺(jué)
2.1 神經(jīng)網(wǎng)絡(luò)基礎(chǔ)
2.2 卷積神經(jīng)網(wǎng)絡(luò)
2.3 典型CNN架構(gòu)模型
2.4 常見(jiàn)深度學(xué)習(xí)框架
第3章 機(jī)器學(xué)習(xí)開(kāi)發(fā)實(shí)踐環(huán)境
3.1 Anaconda開(kāi)發(fā)平臺(tái)
3.2 嵌入式機(jī)器視覺(jué)開(kāi)發(fā)平臺(tái)
3.3 常用數(shù)據(jù)集
第4章 圖像分類(lèi)開(kāi)發(fā)實(shí)踐
4.1 圖像分類(lèi)基本概念及原理
4.2 典型分類(lèi)模型
4.3 軟硬件開(kāi)發(fā)環(huán)境
4.4 圖像分類(lèi)實(shí)戰(zhàn)
第5章 目標(biāo)檢測(cè)開(kāi)發(fā)實(shí)踐
5.1 目標(biāo)檢測(cè)的任務(wù)
5.2 目標(biāo)檢測(cè)的性能指標(biāo)
5.3 目標(biāo)檢測(cè)的算法模型
5.4 YOLOv5目標(biāo)檢測(cè)訓(xùn)練模型
5.5 YOLOv5實(shí)戰(zhàn)
第6章 圖像分割開(kāi)發(fā)實(shí)踐
6.1 圖像分割基本概念
6.2 傳統(tǒng)圖像分割方法
6.3 基于深度學(xué)習(xí)的圖像分割方法
第7章 圖像生成技術(shù)
7.1 圖像生成的基本思想
7.2 圖像生成網(wǎng)絡(luò)理論
7.3 生成對(duì)抗網(wǎng)絡(luò)算法推導(dǎo)
7.4 WGAN的原理
7.5 WGAN的實(shí)現(xiàn)
7.6 WGAN圖像生成實(shí)戰(zhàn)
參考文獻(xiàn)