關(guān)于我們
書(shū)單推薦
新書(shū)推薦
|
深入理解計(jì)算機(jī)視覺(jué):關(guān)鍵算法解析與深度神經(jīng)網(wǎng)絡(luò)設(shè)計(jì) 本書(shū)對(duì)二維、三維目標(biāo)檢測(cè)技術(shù)涉及的骨干網(wǎng)絡(luò)及入門(mén)必備的計(jì)算機(jī)視覺(jué)算法進(jìn)行全面的介紹。本書(shū)由淺入深地介紹了MNIST、ImageNet、CIFAR、波士頓房產(chǎn)、ModelNet等經(jīng)典二維、三維數(shù)據(jù)集和相關(guān)國(guó)際賽事,還介紹了TensorFlow中的二維卷積層、全連接層、激活層、池化層、批次歸一化層、隨機(jī)失活層的算法和梯度下降原理,AlexNet、VGG、ResNet、DarkNet、CSP-DarkNet等經(jīng)典骨干網(wǎng)絡(luò)的設(shè)計(jì)原理,以及PointNet、GCN等三維計(jì)算機(jī)視覺(jué)神經(jīng)網(wǎng)絡(luò)。此外,本書(shū)通過(guò)設(shè)計(jì)巧妙且具體的案例,讓讀者穩(wěn)步建立扎實(shí)的編程能力,包括數(shù)據(jù)集的制作和解析、神經(jīng)網(wǎng)絡(luò)模型設(shè)計(jì)能力和開(kāi)銷(xiāo)估算、損失函數(shù)的設(shè)計(jì)、神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)模式和靜態(tài)模式的訓(xùn)練方法和過(guò)程控制、神經(jīng)網(wǎng)絡(luò)的邊緣計(jì)算模型量化、神經(jīng)網(wǎng)絡(luò)的云計(jì)算部署。完成本書(shū)的學(xué)習(xí),讀者可以繼續(xù)閱讀與本書(shū)緊密銜接的《深入理解計(jì)算機(jī)視覺(jué):在邊緣端構(gòu)建高效的目標(biāo)檢測(cè)系統(tǒng)》,將所學(xué)的計(jì)算機(jī)視覺(jué)基礎(chǔ)知識(shí)運(yùn)用到目標(biāo)檢測(cè)的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)中,對(duì)邊緣計(jì)算環(huán)境下的神經(jīng)網(wǎng)絡(luò)進(jìn)行游刃有余的調(diào)整。 視覺(jué)雙雄,隆重出版! 《深入理解計(jì)算機(jī)視覺(jué):關(guān)鍵算法解析與深度神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)》 《深入理解計(jì)算機(jī)視覺(jué):在邊緣端構(gòu)建高效的目標(biāo)檢測(cè)應(yīng)用》 凝聚作者半生心血,內(nèi)含實(shí)用專(zhuān)利技術(shù) 真正的從實(shí)戰(zhàn)中來(lái),到培訓(xùn)中去,再進(jìn)入實(shí)戰(zhàn) 跟著學(xué)習(xí),就能學(xué)會(huì)AI應(yīng)用構(gòu)建的思路、方法、技巧 堪稱(chēng)ChatGPT式人工智能應(yīng)用開(kāi)發(fā)的保姆級(jí)教程 推薦序一 在人工智能70余年的發(fā)展歷程中,機(jī)器學(xué)習(xí)的重要性不容忽視。隨著神經(jīng)聯(lián)結(jié)主義方法論的不斷發(fā)展,近10年來(lái),建立在深度神經(jīng)網(wǎng)絡(luò)模型之上的深度學(xué)習(xí)技術(shù)異軍突起,已經(jīng)成為人工智能的中堅(jiān)力量。與此同時(shí),計(jì)算機(jī)視覺(jué)技術(shù)也達(dá)到了前所未有的高度。 本書(shū)介紹的計(jì)算機(jī)視覺(jué)相關(guān)技術(shù)是深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域的具體應(yīng)用,不僅介紹了當(dāng)下最為流行的圖像分類(lèi)和目標(biāo)檢測(cè)技術(shù)的算法框架,還介紹了它們的數(shù)據(jù)集處理、云計(jì)算、邊緣計(jì)算的運(yùn)用技巧,過(guò)程詳實(shí)、簡(jiǎn)單實(shí)用。推廣一個(gè)技術(shù)的最好方式就是運(yùn)用它,如果越來(lái)越多的企業(yè)和工程人員能夠運(yùn)用機(jī)器學(xué)習(xí)乃至機(jī)器意識(shí)的相關(guān)技術(shù)為用戶(hù)和社會(huì)創(chuàng)造價(jià)值,那么人工智能的未來(lái)之路就一定會(huì)越走越寬! 人無(wú)遠(yuǎn)慮,必有近憂(yōu)。為了能夠參與全球性的人工智能競(jìng)爭(zhēng)和合作,我們現(xiàn)在就應(yīng)該前瞻性地開(kāi)展前沿關(guān)鍵技術(shù)的基礎(chǔ)性研究。本書(shū)在介紹工程應(yīng)用的同時(shí),還對(duì)深度學(xué)習(xí)的算法原理、神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)意圖等較為基礎(chǔ)和抽象的概念進(jìn)行了介紹,邏輯清晰、形象直觀(guān)。特別是近些年興起的三維計(jì)算機(jī)視覺(jué)和圖卷積神經(jīng)網(wǎng)絡(luò)技術(shù),它們與二維計(jì)算機(jī)視覺(jué)有著千絲萬(wàn)縷的聯(lián)系。唯有夯實(shí)計(jì)算機(jī)視覺(jué)的技術(shù)基礎(chǔ),我們才能參與自動(dòng)駕駛、感知計(jì)算等前沿領(lǐng)域的全球競(jìng)爭(zhēng)和合作。 最后,希望讀者能夠?qū)?shū)中的深度學(xué)習(xí)技術(shù)運(yùn)用到具體問(wèn)題的解決之中,通過(guò)扎實(shí)的研究建立深厚的人工智能理論基礎(chǔ),通過(guò)技術(shù)應(yīng)用積累計(jì)算機(jī)視覺(jué)實(shí)戰(zhàn)經(jīng)驗(yàn),共同參與到讓計(jì)算機(jī)更加靈活地服務(wù)于人類(lèi)社會(huì)的實(shí)踐之中,為智能社會(huì)的發(fā)展貢獻(xiàn)一份力量。 周昌樂(lè) 北京大學(xué)博士,廈門(mén)大學(xué)教授,心智科學(xué)家 中國(guó)人工智能學(xué)會(huì)理事,福建省人工智能學(xué)會(huì)理事長(zhǎng) 推薦序二 I am happy to hear that Eric Zhang wrote a book covering object detection using TensorFlow. He knows how to quickly develop a solution based on the Neural Network using the high level frameworks like TensorFlow which otherwise would have required many more lines of code. The book also covers an end to end development cycle of a Deep Learning neural network and it will be very useful for the readers who are interested in this topic. Writing a book requires an extensive amount of effort and he finally completed it. Congratulations to Eric and all the readers who will gain a lot of useful knowledge from this book as well! Soonson Kwon Google Global ML Developer Programs Lead 我聽(tīng)聞Eric Zhang撰寫(xiě)了這本介紹如何使用TensorFlow進(jìn)行目標(biāo)檢測(cè)的書(shū)。Eric深知如何使用以TensorFlow為代表的機(jī)器學(xué)習(xí)高級(jí)框架來(lái)提高神經(jīng)網(wǎng)絡(luò)的代碼編寫(xiě)效率,以及如何使用深度神經(jīng)網(wǎng)絡(luò)來(lái)快速開(kāi)發(fā)人工智能解決方案。這本書(shū)涵蓋了深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)端到端的全研發(fā)周期,對(duì)于讀者大有裨益。這本書(shū)傾注了Eric的大量心力,祝賀他如愿完成了此書(shū)的編寫(xiě),相信讀者將從這本書(shū)中獲得大量有用的知識(shí)。 Soonson Kwon 谷歌全球機(jī)器學(xué)習(xí)生態(tài)系統(tǒng)項(xiàng)目負(fù)責(zé)人 前言 數(shù)字化時(shí)代的核心是智能化。隨著人工智能技術(shù)的逐步成熟,智能化應(yīng)用不斷涌現(xiàn),因此信息行業(yè)從業(yè)人員需要具備一定的人工智能知識(shí)和技術(shù)儲(chǔ)備。人工智能最突出的兩個(gè)技術(shù)應(yīng)用領(lǐng)域是計(jì)算機(jī)視覺(jué)和自然語(yǔ)言。計(jì)算機(jī)視覺(jué)處理的是圖像,自然語(yǔ)言處理的是語(yǔ)音和語(yǔ)言。由于計(jì)算機(jī)視覺(jué)采用的CNN神經(jīng)元結(jié)構(gòu)較早被提出,技術(shù)方案也較為成熟,因此本書(shū)著重介紹計(jì)算機(jī)視覺(jué)技術(shù)。 在整個(gè)計(jì)算機(jī)視覺(jué)領(lǐng)域中,本書(shū)選擇重點(diǎn)講述二維、三維目標(biāo)檢測(cè)技術(shù),主要基于兩方面的考慮:一方面,目標(biāo)檢測(cè)技術(shù)是當(dāng)前計(jì)算機(jī)視覺(jué)中最具有應(yīng)用價(jià)值的技術(shù),大到自動(dòng)駕駛中的行人和車(chē)輛識(shí)別,小到智慧食堂的餐盤(pán)識(shí)別,日常生活中的視頻監(jiān)控、專(zhuān)業(yè)領(lǐng)域中的路面鋪裝質(zhì)量監(jiān)控都是目標(biāo)檢測(cè)技術(shù)的具體應(yīng)用場(chǎng)景;另一方面,目標(biāo)檢測(cè)神經(jīng)網(wǎng)絡(luò)一般包含骨干網(wǎng)絡(luò)、中段網(wǎng)絡(luò)(特征融合網(wǎng)絡(luò))、頭網(wǎng)絡(luò)(預(yù)測(cè)網(wǎng)絡(luò))、解碼網(wǎng)絡(luò)、數(shù)據(jù)重組網(wǎng)絡(luò)、NMS算法模塊等,知識(shí)點(diǎn)覆蓋較為全面。 從計(jì)算機(jī)視覺(jué)的新手到目標(biāo)檢測(cè)專(zhuān)家的進(jìn)階過(guò)程不僅要求開(kāi)發(fā)者具備數(shù)據(jù)集制作和骨干網(wǎng)絡(luò)設(shè)計(jì)的基本技能,也要求開(kāi)發(fā)者具備中段網(wǎng)絡(luò)、頭網(wǎng)絡(luò)設(shè)計(jì)的技能,更需要具備根據(jù)邊緣端部署和服務(wù)器端部署的要求調(diào)整網(wǎng)絡(luò)的能力?梢哉f(shuō),學(xué)會(huì)了目標(biāo)檢測(cè)技術(shù),就擁有了計(jì)算機(jī)視覺(jué)的完整技術(shù)棧,就具備了較為全面的技能去應(yīng)對(duì)其他計(jì)算機(jī)視覺(jué)項(xiàng)目。 本書(shū)采用的編程計(jì)算框架TensorFlow是深度學(xué)習(xí)領(lǐng)域中應(yīng)用最廣泛的編程框架,最早由谷歌公司推出,目前已被廣泛用于全球各大人工智能企業(yè)的深度學(xué)習(xí)實(shí)驗(yàn)室和工業(yè)生產(chǎn)環(huán)境。互聯(lián)網(wǎng)上大部分的人工智能前沿成果都是通過(guò)TensorFlow實(shí)現(xiàn)的。TensorFlow提供了更齊全的數(shù)據(jù)集支持和更快的數(shù)據(jù)管道,支持GPU和TPU的硬件加速。TensorFlow支持多種環(huán)境部署。開(kāi)發(fā)者可通過(guò)TensorFlow Serving工具將模型部署在服務(wù)器上,還可通過(guò)TensorFlow Lite工具將模型轉(zhuǎn)化為可在邊緣端推理的TFlite格式。特別地,TensorFlow升級(jí)至2.X版本之后可支持Eager Mode的立即執(zhí)行模式,這使得它的編程更加直觀(guān)和便于調(diào)試。 如果執(zhí)著于由淺及深地講授計(jì)算機(jī)視覺(jué)的基礎(chǔ)理論,那么對(duì)讀者而言會(huì)較為抽象、枯燥;如果拼湊、堆砌易于上手的實(shí)踐案例,那么會(huì)落入常用技術(shù)反復(fù)講、關(guān)鍵技術(shù)脈絡(luò)不清的桎梏。因此,本書(shū)通過(guò)設(shè)計(jì)巧妙的案例,將計(jì)算機(jī)視覺(jué)技術(shù)抽絲剝繭,讓讀者在探索計(jì)算機(jī)視覺(jué)的每個(gè)學(xué)習(xí)階段都能找到合適的項(xiàng)目代碼并著手嘗試,從而在積累基礎(chǔ)理論知識(shí)的同時(shí),穩(wěn)步建立實(shí)踐能力。 最后,為避免混淆,有必要厘清兩個(gè)概念人工智能和深度學(xué)習(xí)。人工智能是指應(yīng)用計(jì)算機(jī)達(dá)到與人類(lèi)智慧相當(dāng)?shù)乃,深度學(xué)習(xí)是指運(yùn)用深度神經(jīng)網(wǎng)絡(luò)技術(shù)達(dá)到一定的智能水平。人工智能指向的是效果,深度學(xué)習(xí)指向的是方法,二者不可等同。實(shí)現(xiàn)人工智能的方法不僅有深度學(xué)習(xí),還包含傳統(tǒng)的信息化手段和專(zhuān)家邏輯判斷。但以目前的技術(shù)水平,深度學(xué)習(xí)所能達(dá)到的智能水平是最高的,所以一般用人工智能來(lái)指代深度學(xué)習(xí),也用深度學(xué)習(xí)來(lái)指代人工智能,因此本書(shū)對(duì)二者不進(jìn)行嚴(yán)格的區(qū)分。 為何撰寫(xiě)本書(shū) 筆者在做以目標(biāo)檢測(cè)為主題的講座報(bào)告或技術(shù)分享時(shí),發(fā)現(xiàn)聽(tīng)眾普遍對(duì)人工智能技術(shù)很感興趣,但是又不知從何下手。目標(biāo)檢測(cè)技術(shù)涉及理工科多種基礎(chǔ)知識(shí)和技能。其一是數(shù)學(xué),涉及矩陣計(jì)算、概率分布;其二是編程,涉及計(jì)算框架API和面向?qū)ο蟮腜ython編程技巧;其三是數(shù)據(jù)處理,涉及數(shù)字圖像算法和嵌入式系統(tǒng)。每種基礎(chǔ)知識(shí)和技能都對(duì)應(yīng)著高等教育中的一門(mén)課程,多數(shù)開(kāi)發(fā)者對(duì)此似曾相識(shí),但又理解得不夠深刻。高等教育偏向于挖掘垂直領(lǐng)域,并沒(méi)有刻意將跨領(lǐng)域的知識(shí)融會(huì)貫通。因此,筆者在詳細(xì)講授目標(biāo)檢測(cè)原理和應(yīng)用之前,先詳細(xì)介紹了目標(biāo)檢測(cè)中將會(huì)用到的關(guān)鍵算法,并對(duì)目標(biāo)檢測(cè)中最重要的骨干網(wǎng)絡(luò)進(jìn)行了由淺入深的介紹。深入理解本書(shū)所涵蓋的理論知識(shí)便于讀者閱讀與本書(shū)緊密相關(guān)的進(jìn)階書(shū)籍《深入理解計(jì)算機(jī)視覺(jué):在邊緣端構(gòu)建高效的目標(biāo)檢測(cè)應(yīng)用》,并在目標(biāo)檢測(cè)的理論和實(shí)踐上都達(dá)到一定的高度。 為避免讀者在閱讀公式和代碼時(shí)感到抽象,筆者在編寫(xiě)過(guò)程中有意圍繞較為形象的數(shù)據(jù)流闡釋原理,盡量使用數(shù)據(jù)結(jié)構(gòu)圖來(lái)展示算法對(duì)數(shù)據(jù)的處理意圖和邏輯。相信讀者在理解了輸入/輸出數(shù)據(jù)流結(jié)構(gòu)圖的基礎(chǔ)上,面對(duì)公式和代碼時(shí)不會(huì)感到晦澀。 筆者發(fā)現(xiàn)許多企業(yè)在初期涉足人工智能時(shí),由于對(duì)人工智能不甚了解,陷入了模型選型性能不理想修改失敗嘗試其他模型再次失敗的怪圈。目前有大量的計(jì)算機(jī)視覺(jué)代碼可供下載,簡(jiǎn)單配置后就能成功運(yùn)行,但筆者仍建議從基礎(chǔ)的數(shù)據(jù)集處理、特征提取網(wǎng)絡(luò)入手,建立和解析若干個(gè)數(shù)據(jù)集,深入剖析若干個(gè)經(jīng)典的神經(jīng)網(wǎng)絡(luò),這對(duì)讀者真正掌握目標(biāo)檢測(cè)的原理是很有幫助的。我們?cè)诠ぷ髦须y免會(huì)不斷更換模型,甚至不斷更換框架,如果缺乏對(duì)神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)的深入理解,那么對(duì)每種模型、每個(gè)框架都無(wú)法運(yùn)用自如。不同模型和不同框架在本質(zhì)上有異曲同工之處,筆者希望人工智能從業(yè)人員能扎實(shí)掌握某種框架下具有代表性的模型,在計(jì)算機(jī)視覺(jué)領(lǐng)域中自然也能有所創(chuàng)新。 關(guān)于本書(shū)的作者 作者本科畢業(yè)于天津大學(xué)通信工程專(zhuān)業(yè),碩士研究生階段就讀于廈門(mén)大學(xué),主攻嵌入式系統(tǒng)和數(shù)字信號(hào)底層算法,具備扎實(shí)的理論基礎(chǔ)。作者先后就職于中國(guó)電信和福建省電子信息集團(tuán),目前擔(dān)任福建省人工智能學(xué)會(huì)理事和企業(yè)工作委員會(huì)主任,同時(shí)也擔(dān)任谷歌開(kāi)發(fā)者社區(qū)、亞馬遜開(kāi)發(fā)者生態(tài)的福州區(qū)域負(fù)責(zé)人。作者長(zhǎng)期從事計(jì)算機(jī)視覺(jué)和自然語(yǔ)言基礎(chǔ)技術(shù)的研究,積累了豐富的人工智能項(xiàng)目經(jīng)驗(yàn),致力于推動(dòng)深度學(xué)習(xí)在交通、工業(yè)、民生、建筑等應(yīng)用領(lǐng)域的落地。作者于2017年獲得高級(jí)工程師職稱(chēng),擁有多項(xiàng)發(fā)明專(zhuān)利。 本書(shū)作者GitHub賬號(hào)是fjzhangcr。 本書(shū)的主要內(nèi)容 本書(shū)共6篇,第1篇至第4篇適合開(kāi)發(fā)者和本科生快速入門(mén)計(jì)算機(jī)視覺(jué),第5篇涉及目標(biāo)檢測(cè)中的特征提取網(wǎng)絡(luò)設(shè)計(jì)原理和技巧,第6篇涉及三維計(jì)算機(jī)視覺(jué)入門(mén)和實(shí)戰(zhàn),適合進(jìn)階開(kāi)發(fā)者和高等院校高年級(jí)學(xué)生深入了解人工智能。本書(shū)的主要內(nèi)容如下。 第1篇旨在讓讀者快速搭建TensorFlow開(kāi)發(fā)環(huán)境,并使用TensorFlow快速建立基礎(chǔ)的神經(jīng)網(wǎng)絡(luò)。在具備開(kāi)發(fā)環(huán)境的條件下,即使是第一次接觸計(jì)算機(jī)視覺(jué)的新手,利用TensorFlow強(qiáng)大的編程能力,預(yù)計(jì)也能在10分鐘內(nèi)完成該篇介紹的圖像分類(lèi)項(xiàng)目。 第2篇旨在讓讀者快速熟悉計(jì)算機(jī)視覺(jué)的開(kāi)發(fā)流程。從數(shù)據(jù)集的制作入手,延伸至神經(jīng)網(wǎng)絡(luò)的構(gòu)建、編譯和訓(xùn)練,以及神經(jīng)網(wǎng)絡(luò)靜態(tài)圖的邊緣端和服務(wù)器端的部署,掌握該篇內(nèi)容就可以應(yīng)對(duì)大多數(shù)企業(yè)計(jì)算機(jī)視覺(jué)項(xiàng)目的研發(fā)、生產(chǎn)和運(yùn)維。 第3篇旨在讓讀者深入理解深度學(xué)習(xí)的原理和TensorFlow的類(lèi)繼承關(guān)系。神經(jīng)網(wǎng)絡(luò)的本質(zhì)是函數(shù),該篇給出了神經(jīng)網(wǎng)絡(luò)推理和訓(xùn)練的數(shù)學(xué)定義,幫助開(kāi)發(fā)者在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)理論領(lǐng)域有所創(chuàng)新。該篇還介紹了TensorFlow的自動(dòng)微分機(jī)制和基礎(chǔ)類(lèi)的繼承關(guān)系,有助于開(kāi)發(fā)者靈活地使用層和模型定義工具,將基礎(chǔ)理論創(chuàng)新轉(zhuǎn)化為代碼編程實(shí)踐。 第4篇旨在讓讀者熟練使用TensorFlow的重要層組件組裝模型。該篇并非枯燥地介紹層組件的屬性,而是通過(guò)計(jì)算機(jī)視覺(jué)神經(jīng)網(wǎng)絡(luò)的經(jīng)典案例,讓讀者快速了解和掌握這些層組件的屬性和資源開(kāi)銷(xiāo)。雖然這些神經(jīng)網(wǎng)絡(luò)只能用于圖像分類(lèi),但在目標(biāo)檢測(cè)的計(jì)算機(jī)視覺(jué)應(yīng)用中承擔(dān)著特征提取的重要職責(zé)。該篇還介紹了神經(jīng)網(wǎng)絡(luò)計(jì)算加速硬件、TensorFlow的訓(xùn)練方法和訓(xùn)練過(guò)程監(jiān)控,方便開(kāi)發(fā)者靈活調(diào)用。 第5篇由淺及深地介紹了目標(biāo)檢測(cè)中的特征提取網(wǎng)絡(luò)。該篇介紹的若干神經(jīng)網(wǎng)絡(luò)非常經(jīng)典,小核卷積和殘差連接是目前神經(jīng)網(wǎng)絡(luò)廣泛使用的設(shè)計(jì)思路。該篇還介紹了目標(biāo)檢測(cè)神經(jīng)網(wǎng)絡(luò)中性能較強(qiáng)的特征提取骨干網(wǎng)絡(luò)和知名計(jì)算機(jī)視覺(jué)數(shù)據(jù)集,以及如何使用預(yù)訓(xùn)練權(quán)重進(jìn)行遷移學(xué)習(xí)。 第6篇旨在讓讀者了解三維機(jī)器學(xué)習(xí)領(lǐng)域,三維計(jì)算機(jī)視覺(jué)使用的數(shù)據(jù)表達(dá)方式與二維計(jì)算機(jī)視覺(jué)有著巨大的差別,對(duì)神經(jīng)網(wǎng)絡(luò)也有著特殊的要求。該篇在三維數(shù)據(jù)格式的基礎(chǔ)上介紹了從二維數(shù)據(jù)重建三維物體的若干神經(jīng)網(wǎng)絡(luò),并借助實(shí)際的編程案例展示了三維物體的識(shí)別。因?yàn)槿S視覺(jué)數(shù)據(jù)在本質(zhì)上是一個(gè)圖,所以該篇還介紹了圖計(jì)算的相關(guān)基礎(chǔ)理論,展示了基于圖卷積神經(jīng)網(wǎng)絡(luò)的具體應(yīng)用。 附錄中說(shuō)明了本書(shū)的官方代碼引用、運(yùn)行環(huán)境搭建,以及TensorFlow矩陣的基本操作。讀者若對(duì)基本操作有疑問(wèn),則可以根據(jù)附錄說(shuō)明登錄相關(guān)網(wǎng)站進(jìn)行查閱和提問(wèn)。 如何閱讀本書(shū) 本書(shū)適合具備一定計(jì)算機(jī)、通信、電子等理工科專(zhuān)業(yè)基礎(chǔ)的本科生、研究生及具有轉(zhuǎn)型意愿的軟件工程師閱讀。讀者應(yīng)當(dāng)具備高等數(shù)學(xué)、線(xiàn)性代數(shù)、概率論、Python編程、圖像處理等基礎(chǔ)知識(shí)。上述知識(shí)有所遺忘也無(wú)大礙,本書(shū)會(huì)幫助讀者進(jìn)行適當(dāng)?shù)臏亓?xí)和回顧。 如果希望快速了解計(jì)算機(jī)視覺(jué)的整體概念,那么建議閱讀本書(shū)的第1篇、第2篇。第1篇、第2篇以花卉識(shí)別的案例,介紹了計(jì)算機(jī)視覺(jué)項(xiàng)目從數(shù)據(jù)集到訓(xùn)練,再到云計(jì)算部署和邊緣部署的全部流程。讀者閱讀這部分內(nèi)容后,只需要稍微調(diào)整數(shù)據(jù)集,就可以實(shí)現(xiàn)個(gè)性化的計(jì)算機(jī)視覺(jué)項(xiàng)目。 如果希望深入掌握計(jì)算機(jī)視覺(jué)的基礎(chǔ)原理,那么建議仔細(xì)閱讀本書(shū)的第3篇、第4篇,這部分內(nèi)容將介紹目標(biāo)檢測(cè)網(wǎng)絡(luò)中骨干網(wǎng)絡(luò)的結(jié)構(gòu)及搭建網(wǎng)絡(luò)必需的各種層組件,幫助讀者形成觸類(lèi)旁通的知識(shí)沉淀。 如果希望掌握計(jì)算機(jī)視覺(jué)神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)原理,那么建議仔細(xì)閱讀本書(shū)的第5篇。第5篇介紹了若干經(jīng)典的骨干網(wǎng)絡(luò),骨干網(wǎng)絡(luò)負(fù)責(zé)提取特征,是所有計(jì)算機(jī)視覺(jué)神經(jīng)網(wǎng)絡(luò)擁有的結(jié)構(gòu)單元。掌握骨干網(wǎng)絡(luò)的設(shè)計(jì)原理能夠培養(yǎng)領(lǐng)悟計(jì)算機(jī)視覺(jué)相關(guān)文獻(xiàn)和代碼的能力,從而具備神經(jīng)網(wǎng)絡(luò)定制和開(kāi)發(fā)的能力。 如果讀者對(duì)二維計(jì)算機(jī)視覺(jué)已經(jīng)有了較為深刻的認(rèn)識(shí),那么可以通過(guò)第6篇快速入門(mén)三維計(jì)算機(jī)視覺(jué)。雖然三維計(jì)算機(jī)視覺(jué)在數(shù)據(jù)結(jié)構(gòu)和算法實(shí)現(xiàn)上與二維計(jì)算機(jī)視覺(jué)不同,但三維計(jì)算機(jī)視覺(jué)神經(jīng)網(wǎng)絡(luò)仍大量借鑒了二維計(jì)算機(jī)視覺(jué)的設(shè)計(jì)邏輯和層組件。 讀完本書(shū),相信讀者能夠掌握層組件的原理,具備多種神經(jīng)網(wǎng)絡(luò)的知識(shí),理解二維、三維計(jì)算機(jī)視覺(jué)的異同點(diǎn),熟練使用TensorFlow開(kāi)發(fā)框架,從而應(yīng)對(duì)復(fù)雜多變的應(yīng)用場(chǎng)景。 本書(shū)遵循理論和實(shí)踐相融合的編寫(xiě)原則,讀者可以直接通過(guò)代碼示例加深理論理解。數(shù)學(xué)是工科的基礎(chǔ),理論永遠(yuǎn)走在技術(shù)的前面。建議讀者務(wù)必按照本書(shū)的篇章順序,動(dòng)手實(shí)踐書(shū)中介紹的計(jì)算機(jī)視覺(jué)項(xiàng)目,從零開(kāi)始打好計(jì)算機(jī)視覺(jué)基礎(chǔ),從而更快上手其他計(jì)算機(jī)視覺(jué)技術(shù)(如目標(biāo)檢測(cè)、圖像分割、圖像注意力機(jī)制、圖像擴(kuò)散模型等)。另外,需要聲明的是,由于本書(shū)涉及實(shí)際工程知識(shí)較多,所以在書(shū)中習(xí)慣性地將計(jì)算機(jī)視覺(jué)稱(chēng)為機(jī)器視覺(jué),機(jī)器視覺(jué)是計(jì)算機(jī)視覺(jué)在實(shí)際工程中的應(yīng)用。 致謝 感謝我的家人,特別是我的兒子,是你平時(shí)提出的一些問(wèn)題,推動(dòng)我不斷地思考人工智能的哲學(xué)和原理,這門(mén)充斥著公式和代碼的學(xué)科背后其實(shí)也有著淺顯和直白的因果邏輯。 感謝求學(xué)路上福州格致中學(xué)的王恩奇老師,福州第一中學(xué)的林立燦老師,天津大學(xué)的李慧湘老師,廈門(mén)大學(xué)的黃聯(lián)芬老師、鄭靈翔老師,是你們當(dāng)年的督促和鼓勵(lì)讓我有能力和勇氣用知識(shí)去求索技術(shù)的極限。 感謝福建省人工智能學(xué)會(huì)的周昌樂(lè)理事長(zhǎng),谷歌全球機(jī)器學(xué)習(xí)開(kāi)發(fā)者生態(tài)的負(fù)責(zé)人Soonson Kwon,谷歌Coral產(chǎn)品線(xiàn)負(fù)責(zé)人欒躍,谷歌中國(guó)的魏巍、李雙峰,北京算能科技有限公司的范硯池、金佳萍、張晉、侯雨、吳楠、檀庭梁、劉晨曦,福州十方網(wǎng)絡(luò)科技有限公司,福建米多多網(wǎng)絡(luò)科技有限公司,福州樂(lè)凡唯悅網(wǎng)絡(luò)科技有限公司及那些無(wú)法一一羅列的默默支持我的專(zhuān)家。感謝你們一直以來(lái)對(duì)人工智能產(chǎn)業(yè)的關(guān)注,感謝你們對(duì)本書(shū)的關(guān)懷和支持。 感謝電子工業(yè)出版社計(jì)算機(jī)專(zhuān)業(yè)圖書(shū)分社社長(zhǎng)孫學(xué)瑛女士,珠海金山數(shù)字網(wǎng)絡(luò)科技有限公司(西山居)人工智能技術(shù)專(zhuān)家、高級(jí)算法工程師黃鴻波的熱情推動(dòng),最終促成了我將內(nèi)部培訓(xùn)文檔出版成圖書(shū),讓更多的人看到。你們具有敏銳的市場(chǎng)眼光,你們將傾聽(tīng)到的致力于人工智能領(lǐng)域的廣大開(kāi)發(fā)者的心聲與我分享,堅(jiān)定了我將技術(shù)積淀整理成書(shū)稿進(jìn)行分享的決心。在本書(shū)的整理寫(xiě)作過(guò)程中,你們多次邀請(qǐng)專(zhuān)家提出有益意見(jiàn),對(duì)于本書(shū)的修改和完善起到了重要作用。 由于作者水平有限,書(shū)中難免存在不足之處,敬請(qǐng)專(zhuān)家和讀者批評(píng)指正。 張晨然 2023年2月 作者本科畢業(yè)于天津大學(xué)通信工程專(zhuān)業(yè),碩士研究生階段就讀于廈門(mén)大學(xué),主攻嵌入式系統(tǒng)和數(shù)字信號(hào)底層算法,具備扎實(shí)的理論基礎(chǔ)。作者先后就職于中國(guó)電信集團(tuán)公司和福建省電子信息(集團(tuán))有限責(zé)任公司,目前擔(dān)任福建省人工智能學(xué)會(huì)的理事和企業(yè)工作委員會(huì)的主任,同時(shí)也擔(dān)任谷歌開(kāi)發(fā)者社區(qū)、亞馬遜開(kāi)發(fā)者生態(tài)的福州區(qū)域負(fù)責(zé)人,長(zhǎng)期從事機(jī)器視覺(jué)和自然語(yǔ)言基礎(chǔ)技術(shù)的研究,積累了豐富的人工智能項(xiàng)目經(jīng)驗(yàn),致力于推動(dòng)深度學(xué)習(xí)在交通、工業(yè)、民生、建筑等領(lǐng)域的應(yīng)用落地。作者于2017年獲得高級(jí)工程師職稱(chēng),擁有多項(xiàng)發(fā)明專(zhuān)利。 目錄
你還可能感興趣
我要評(píng)論
|