關(guān)于我們
書單推薦
新書推薦
|
深度學習:從入門到實戰(zhàn)
深度學習:從入門到實戰(zhàn)摒棄了枯燥的理論推導(dǎo),以大量實戰(zhàn)應(yīng)用案例及知識模塊等內(nèi)容幫助機器學習領(lǐng)域的初、中級程序員踏實通過深度學習的技術(shù)門檻,切實提升開發(fā)技能,積累開發(fā)經(jīng)驗。實戰(zhàn)應(yīng)用案例豐富,深入淺出地解析深度學習的方法論和深度學習實戰(zhàn)應(yīng)用是本書的一大特色,全書詳細講述了深度學習中涉及的神經(jīng)網(wǎng)絡(luò)基礎(chǔ)知識、方法論解析與核心技術(shù);同時從12個落地實踐角度闡述了深度學習的實踐應(yīng)用。此外,本書中所有案例的代碼程序均可以運行,讀者按照相應(yīng)說明,即可得到預(yù)期效果,希望本書的努力可以為讀者在深度學習領(lǐng)域提供一定幫助,這就是我們的動力與追求。
前言 隨著云計算、大數(shù)據(jù)、人工智能技術(shù)的深度發(fā)展,大數(shù)據(jù)帶來了海量多源異構(gòu)數(shù)據(jù)的積累,云計算帶來了超強計算能力,在這樣呼喚創(chuàng)新的新時代背景下,深度學習起起伏伏幾十載,今天終于走上了人工智能的巔峰?梢哉f,經(jīng)過數(shù)據(jù)、算力(計算能力)、算法的深度融合和推動,深度學習已經(jīng)成長為目前最主流并且最具有應(yīng)用前景的機器學習技術(shù)。本書盡量避免過多繁雜的理論推導(dǎo),力圖用深入淺出的語言表達,讓更多讀者輕松邁入深度學習的大門。同時,希望通過大量的案例和實戰(zhàn)應(yīng)用,幫助讀者快速上手、入門深度學習,了解深度學習可以應(yīng)用于哪些領(lǐng)域,擅長解決哪些經(jīng)典難題,以便在后續(xù)的學習研究過程中,從本書講解的方法論解析中獲得啟迪,找到真正屬于自己的解決人工智能領(lǐng)域問題的金鑰匙。 讀者對象 本書適合以下讀者群體閱讀: (1)對人工智能、大數(shù)據(jù)、云計算等新興技術(shù)感興趣的愛好者 人工智能無疑是站在巨人肩膀大數(shù)據(jù)和云計算上的產(chǎn)物,可以說,數(shù)據(jù)和計算能力的支撐,是人工智能發(fā)展的基石,而深度學習就是這個領(lǐng)域最頂層的技術(shù),因此,本書可以幫助讀者在入門深度學習的同時,對大數(shù)據(jù)和云計算技術(shù)有整體把握,理解深度學習在云計算、大數(shù)據(jù)時代的重要性。 (2)開源項目的愛好者 深度學習技術(shù)已經(jīng)創(chuàng)造了大量的開源項目,擁有大量的開源項目維護團隊和貢獻者。例如,Google開源的TensorFlow框架、賈揚清博士(現(xiàn)就職于Facebook)開源的Caffe框架、亞馬遜主推的MXNet框架等等。本書在實戰(zhàn)案例部分的講解涉及了不同開源框架的源代碼,以期在眾口難調(diào)的深度學習領(lǐng)域,實現(xiàn)調(diào)眾口的作用,幫助讀者了解和掌握主流深度學習框架源代碼的設(shè)計思想和核心技術(shù)。 (3)深度學習、機器學習、人工智能技術(shù)的開發(fā)者 不論是在市場還是技術(shù)層面,人工智能領(lǐng)域的關(guān)注度持續(xù)火熱。很多未入門深度學習的讀者都想近距離感受深度學習的魅力,而很多深度學習的初級開發(fā)者也苦于該領(lǐng)域的技術(shù)飛速更新迭代,很難梳理出適合自己領(lǐng)域的知識圖譜。因此,本書在講解中兼顧了對入門級讀者關(guān)于基本概念、基本知識點的介紹,并加強了在實戰(zhàn)部分對領(lǐng)域知識的總結(jié),使得不同層次的開發(fā)者都可以從本書中得到急需的方法與技巧指導(dǎo)。 (4)高等院校計算機相關(guān)專業(yè)的大四和一年級碩士研究生 從學科分類的本質(zhì)屬性上講,深度學習與計算機科學與技術(shù)學科有很深的淵源,而高等院校計算機相關(guān)專業(yè)的學生,不論是在未來就業(yè)還是在求學期間的科學研究,都是深度學習領(lǐng)域研究的新生力量和重要創(chuàng)新、推廣、優(yōu)化、提升的動力儲備。本書在講解相對專業(yè)的理論知識點時,會穿插分析其中蘊含的方法論思想,希望可以為正在書海作舟的讀者們提供一些啟迪,增強對深度學習所涉及方法論知識的理解,為今后的工作、學習、生活提供一定的指導(dǎo)和幫助。 本書愿景 對于大多數(shù)理工科出身的程序員來說,人文社科類的思想、理論、見解,就像是海市蜃樓,愿景是如此美好,但是現(xiàn)實的骨感、抽象讓其望而卻步。因此本書可以作為以深度學習基礎(chǔ)理論為根基,以其蘊含的方法論思想為導(dǎo)向,幫助理工男(女)掌握深度學習核心技術(shù),并懷著智者情懷,去懸壺濟世,融入新時代的人工智能大潮,去踐行長風破浪會有時,直掛云帆濟滄海的宏圖大志。 作為技術(shù)類的科技書籍,本書希望幫助讀者解析深度學習蘊含的方法論思維模式,同時培養(yǎng)其掌握深度學習實戰(zhàn)應(yīng)用的技能,進而完成在深度學習領(lǐng)域入門精通實戰(zhàn)的不斷提升,完成從新手小白到領(lǐng)域行家的轉(zhuǎn)變,從技能和方法論兩個層面上,全面武裝讀者,完成深度學習:從入門到實戰(zhàn)。 深度學習的意義 掌握深度學習的好處如下: (1)從個人發(fā)展的角度講,作為一名新時代的程序員或者IT技術(shù)相關(guān)領(lǐng)域工作者,人工智能領(lǐng)域人才的極度短缺,這是一個全球性的行業(yè)現(xiàn)狀,因此,以深度學習為代表的核心技術(shù)也就是該領(lǐng)域從業(yè)者的核心競爭力。也就是說,掌握了深度學習技術(shù),也就具備了進軍人工智能的通關(guān)令牌,這對接下來的技術(shù)提升、就業(yè)等方面都具有很大的推動作用。 (2)從知識學習的角度講,深度學習是一個交叉學科的產(chǎn)物,是橫跨現(xiàn)代生物學中的腦科學、心理學以及計算機科學中的數(shù)據(jù)工程、軟件工程、程序設(shè)計、并行計算等軟硬兼顧的技術(shù)。掌握了深度學習,讀者將會對計算機領(lǐng)域的相關(guān)技術(shù)構(gòu)建起一個更加清晰的知識圖譜,即便在計算機科學領(lǐng)域知識不斷拓展,新概念、新知識層出不窮的今天,掌握深度學習的核心思想與技術(shù),對優(yōu)化個人知識結(jié)構(gòu)的合理性,提高綜合能力的全面性,都是大有裨益的。 (3)從思維模式的角度講,深度學習不僅是抽象的理論技術(shù),更是一種鮮活有溫度的思維模式,熟練掌握深度學習的核心思維模式,構(gòu)建優(yōu)化的體系全局觀,運用局部微調(diào)、逐層優(yōu)化的處事策略,在各個領(lǐng)域都會產(chǎn)生普遍的適用價值。因此,也希望本書在思維模式上對讀者有所啟迪。 成為專業(yè)深度學習程序員的臺階 我們都知道,從小白到專業(yè)的程序員,是有幾個臺階需要逐一跨越的,下面梳理一下深度學習程序員的成長過程: 第一個臺階,操作系統(tǒng)入門。操作系統(tǒng)是連接用戶與機器之間的橋梁,掌握Linux操作系統(tǒng)的基礎(chǔ)知識、基本操作是邁進深度學習大門的第一步。雖然,目前也有基于Windows系列操作系統(tǒng)的深度學習開發(fā)組件,但從開發(fā)者成長的長遠角度講,不建議長期依賴Windows系統(tǒng),對于一個開發(fā)者來講,自由、可控、高效永遠是第一追求。 第二個臺階,掌握編程語言。目前深度學習最友好的編程語言是Python。因此,在掌握一定面向?qū)ο缶幊碳记傻幕A(chǔ)上,不斷加深對Python編程模式、豐富的庫函數(shù)的理解與運用,是學習深度學習的重要階段。如果對Java和C(或C )有一定編程學習基礎(chǔ),這會對深度學習的進階有很大幫助。 第三個臺階,初步理解深度學習的基本原理。即使對機器學習、神經(jīng)網(wǎng)絡(luò)等基礎(chǔ)理論及算法無法全面吃透,但是從宏觀上了解其核心思想,也是對下一階段的實際運用大有好處。畢竟,理論可以指導(dǎo)實踐,同時實踐可以反哺理論的完善與理解。 第四個臺階,初步掌握深度學習的框架。有了對深度學習基本原理的理解,結(jié)合目前主流的深度學習框架,對其進行深入剖析,從實戰(zhàn)的角度促進對原理的理解。至于深度學習框架,Keras和Caffe目前比較適合初學者入門。 第五個臺階,在實戰(zhàn)中增強對基本原理和框架的駕馭能力。理論和實踐是相輔相成的,將二者相互促進、相互融合是一個成功的深度學習程序員的最高境界。 在跨越了這五個臺階之后,只需要再經(jīng)歷一些大型實戰(zhàn)項目的深度歷練,即可成為一個優(yōu)秀的深度學習程序員。 深度學習的進階地圖 結(jié)合多年的人工智能領(lǐng)域?qū)W習和成長經(jīng)驗,我們勾勒出一個深度學習的進階地圖(roadmap)。 學習 階段 學習內(nèi)容和目標 上機 實踐 入門 操作系統(tǒng)基礎(chǔ)知識,尤其強化對Linux操作系統(tǒng)的運用技能訓練;編程語言的熟練掌握,尤其加強的Python的基本語法規(guī)則、函數(shù)庫的掌握與運用 18小時 精通 理解深度學習的基本原理,掌握神經(jīng)元模型、BP神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、生成式對抗網(wǎng)絡(luò)的核心技術(shù)。 24小時 掌握深度學習的主流開發(fā)框架,至少精通一種成熟的框架。以Caffe為例,可以實現(xiàn)對深度學習的基本原理的實現(xiàn),包括單神經(jīng)元、單層網(wǎng)絡(luò)、多層網(wǎng)絡(luò)、BP算法、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、生成式對抗網(wǎng)絡(luò)的實現(xiàn)及參數(shù)調(diào)優(yōu),并且可以對模型結(jié)構(gòu)進行適度優(yōu)化調(diào)整。 24小時 實戰(zhàn) 結(jié)合深度學習基本理論及開發(fā)框架,對語音、視頻、自然語言理解、計算機視覺等方面進行實戰(zhàn)化項目開發(fā)和驗證,并構(gòu)建不同領(lǐng)域解決問題方案的架構(gòu)體系,針對效率、效果、性能等方面的問題,可以創(chuàng)造性地提出優(yōu)化的高性能深度學習模型,并在實戰(zhàn)中取得良好效果。 36小時 根據(jù)深度學習的進階地圖和學習經(jīng)驗,我們設(shè)計了本書的內(nèi)容。全書共12章,分為3篇,下面分別介紹這三篇的內(nèi)容安排。 第1篇深度學習入門篇 第1篇可被視作是深度學習相關(guān)基礎(chǔ)知識的濃縮,幫助讀者回顧并初步了解深度學習最核心的內(nèi)容。深度學習的入門篇包括第0~2章,其中第0章旨在幫助讀者理清深度學習、機器學習、人工智能之間的關(guān)系,從宏觀上把握整個深度學習領(lǐng)域的生態(tài)系統(tǒng),了解深度學習的發(fā)展方向及前沿趨勢。第1章提綱挈領(lǐng)地講解矩陣理論、概率理論、機器學習方法、神經(jīng)網(wǎng)絡(luò)以及部分最優(yōu)化原理,旨在幫助讀者夯實深度學習的理論基礎(chǔ),為進一步探索深度學習的核心技術(shù)充實知識儲備。第2章旨在幫助讀者揭開神經(jīng)網(wǎng)絡(luò)的神秘面紗,從單個M-P神經(jīng)元到感知機模型,再到多層前饋神經(jīng)網(wǎng)絡(luò),逐步進入深度神經(jīng)網(wǎng)絡(luò)的核心世界,讓讀者按照神經(jīng)網(wǎng)絡(luò)不斷完善優(yōu)化的成長軌跡,感受一段深度學習的成長歷程。 總的來說,第1篇是拋磚引玉,畢竟深度學習是一個多學科交叉融合的技術(shù),與其面面俱到不如突出重點,希望讀者從本篇開始夯實深度學習的理論基礎(chǔ)。 第2篇深度學習方法論解析篇 方法論是技術(shù)的靈魂;反之,技術(shù)是方法論的客觀體現(xiàn)。第2篇是深度學習的方法論解析篇,包括第3~5章,通篇貫穿著方法論的辯證思想,從圖像、視頻、語音等領(lǐng)域的關(guān)鍵技術(shù)出發(fā),分別講解卷積神經(jīng)網(wǎng)絡(luò)(CNN)、生成式對抗網(wǎng)絡(luò)(GAN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的核心技術(shù)及其方法論思想。其中第3章以卷積神經(jīng)網(wǎng)絡(luò)中逐層抽象、平移不變、局部連接(稀疏)、權(quán)值共享等為核心,全方位詮釋人生智慧中升華、適應(yīng)、舍得、合作的精髓。第4章解讀了生成式對抗網(wǎng)絡(luò)中蘊含的博弈、學習、平衡的方法論思想。第5章通過案例剖析,講解循環(huán)神經(jīng)網(wǎng)絡(luò)中涉及的記憶與遺忘,借鑒與提升等思想。 本書的一大亮點就是在講解深度學習核心技術(shù)的同時,用大量的知識擴容和認知提升模塊剖析其中蘊含的方法論思想,以期對深度學習進行內(nèi)外兼修講解和重塑。 第3篇深度學習實戰(zhàn)篇 戰(zhàn)場是檢驗戰(zhàn)斗力的試金石。結(jié)合第1篇、第2篇的知識儲備,第3篇從實戰(zhàn)應(yīng)用的角度展示深度學習在多個維度的應(yīng)用場景,包括第6~11章。工欲善其事必先利其器,第6章介紹主流的深度學習工具及框架,對Python、MATLAB、TensorFlow、Caffe等工具進行了講解。第7章從圖像分類、特征提取、遷移學習、特征可視化角度全面解析首個深度卷積神經(jīng)網(wǎng)絡(luò)模型AlexNet的原理與實戰(zhàn)應(yīng)用。第8章從Hello Word級別的手寫數(shù)字開始,依次對手寫漢字識別、手寫數(shù)字角度矯正進行實戰(zhàn),將手寫體識別進行到底。第9章以視頻監(jiān)控中人臉檢測和物體檢測為例,闡釋深度學習在安防領(lǐng)域的研究意義和研究現(xiàn)狀,剖析了深度學習在視頻監(jiān)控檢測中的實戰(zhàn)應(yīng)用。第10章介紹了信息安全領(lǐng)域的信息隱藏技術(shù),并結(jié)合團隊最新研究成果,以生成式對抗網(wǎng)絡(luò)為核心技術(shù)提出無載體的信息隱藏方案。第11章以軟件設(shè)計大賽題目為背景,利用深度學習技術(shù)為服裝檢測問題提出可行的解決方案,是深度學習技術(shù)在服裝識別技術(shù)的有益探索。 本篇是對全書講解知識點的總結(jié)與提升,只有對知識點的融匯才能實現(xiàn)能力上的貫通,通過對所學知識的實戰(zhàn)應(yīng)用,相信讀者可以真正的融匯貫通。 本書學習建議 本書共分為3篇,第1篇為深度學習的入門篇,第2篇為深度學習的方法論解析篇,第3篇為深度學習的實戰(zhàn)篇。如果你是一名具有一定機器學習、人工智能基礎(chǔ)和實際操作經(jīng)驗的讀者,那么可以直接閱讀后兩篇。方法論解析篇側(cè)重于對經(jīng)典深度學習模型的原理講解及其蘊含的方法論解析,實戰(zhàn)篇側(cè)重于多領(lǐng)域的案例實戰(zhàn)和解決方案分析,讀者可以按實際情況自行安排學習計劃。但是,如果你是一名初學者,建議你從第1篇開始仔細研讀所有的知識點,這對后續(xù)的學習是至關(guān)重要的。 后續(xù)學習與提高 有了本書的學習基礎(chǔ),讀者可以從以下兩個方向進行后續(xù)學習和提高。 (1)繼續(xù)對深度學習的基礎(chǔ)理論進行深入學習,尤其對最優(yōu)化技術(shù)、矩陣論、并行計算等核心知識進行深入剖析,探索深度學習在理論上的突破。 (2)繼續(xù)將所學的深度學習理論和模型應(yīng)用到更廣闊的領(lǐng)域,包括語音、圖像、視頻、自然語言理解、計算機視覺;其實,對其中任意一個領(lǐng)域的不斷探索都可以讓你成為該領(lǐng)域的專家。 當然,希望你不斷保持對人工智能領(lǐng)域技術(shù)的探索熱情,繼續(xù)閱讀更多的深度學習著作,不斷提升自己的核心技術(shù)能力,真正成為深度學習的行家里手。 輔助學習材料 Caffe官方教程中譯本 人工智能頂級會議論文 本書源代碼 本書參考文獻和全書參考資源 以上內(nèi)容,我們整體打包放在了封底二維碼中,讀者可掃碼下載學習。 致謝 深度學習的原理與人的一生極為相似,都是在以不斷追求目標利益最大化的前提下,反復(fù)的磨練、妥協(xié)、修正、適應(yīng)、取舍、優(yōu)化,不斷地權(quán)衡利弊,不斷地折中妥協(xié),不斷地在舍得中博弈決策,最終實現(xiàn)目標效益的最優(yōu)化。筆者希望在講解理論技術(shù)的同時,將這些人生感悟與讀者分享,給還在不斷探索與追逐夢想的讀者一些啟迪,找到屬于自己的螺旋式上升,波浪式前進的人生之路。 在本書的撰寫過程中,崔翛龍教授、張之明教授提出了大量寶貴建議,同時感謝碩士研究生曾子賢、彭圳生、段妍羽、王赟、張俊等做了資料整理以及文字校正工作,在此表示由衷的感謝。 感謝武信和位智團隊的小伙伴們,從你們那里,我看到了一個充滿活力、充滿創(chuàng)造力,能打仗、打勝仗的鐵一般的隊伍。 感謝本書的所有編輯,感謝大家的辛勤勞動,是你們的支持與鼓勵才有這本書的順利出版。 最后感謝我的家人以及未來的妻子文文,你們是我不懈奮斗的動力。 編者 2018年4月
高志強,軍隊指揮學武警信息化研究方向博士,畢業(yè)于中國人民武裝警察部隊工程大學,武警部隊首屆軍事大數(shù)據(jù)工程專業(yè)籌備組成員。作為骨干成員參與研制多項武警部隊信息化裝備及平臺系統(tǒng),參與國家自然科學基金2項、陜西省自然科學基金1項。主要研究方向:深度學習、大數(shù)據(jù)與智能計算、面向大數(shù)據(jù)開放與治理的差分隱私保護數(shù)據(jù)發(fā)布關(guān)鍵技術(shù)研究及應(yīng)用、粒子群優(yōu)化算法等。
黃劍,現(xiàn)為武警工程大學教員,技術(shù)十一級,少校警銜,主要研究領(lǐng)域包括,武警信息化,軍隊指揮學,軍事智能系統(tǒng)。 李永,男,博士,碩士生導(dǎo)師,武警工程大學計算機基礎(chǔ)教研室副主任。2011年12 月獲國防科大計算機科學與技術(shù)博士學位。中國計算機學會會員。研究領(lǐng)域為機器學習,模式識別、圖像處理和國產(chǎn)自主可控軟件應(yīng)用。長期從事《程序設(shè)計基礎(chǔ)》、《高級人工智能》、《計算機邏輯學》、《數(shù)據(jù)庫基礎(chǔ)》等計算機領(lǐng)域教學工作,發(fā)表論文20 余篇。曾獲武警部隊科技進步一等獎和軍隊教學成果三等獎。 劉明明,男,碩士學歷,武警工程大學教員。研究方向為信息隱藏,深度學習。 第1篇深度學習入門篇 第0章引言:從人工智能到深度學習 2 0.1 人工智能與機器學習 2 0.1.1 人工智能 3 【知識擴容】大數(shù)據(jù)帶來的挑戰(zhàn) 4 0.1.2 機器學習 4 【認知提升】細說圖靈測試 5 【新觀點】機器學習適合做什么 6 0.2 機器學習的模式 7 【知識擴容】人工智能學派之爭 8 0.3 深度學習 9 【案例0-1】天氣預(yù)報深度神經(jīng)網(wǎng)絡(luò) 9 【認知提升】說文解字深度學習 11 【應(yīng)知應(yīng)會】深度與學習 12 【最佳實踐】減小損失函數(shù)的方法 12 0.4 溫故知新 13 0.5 停下來,思考一下 14 第1章深度學習入門基礎(chǔ) 16 1.1 數(shù)學基礎(chǔ) 16 1.1.1 矩陣論基礎(chǔ) 17 【案例1-1】像指揮官一樣對矩陣進行排兵布陣 18 1.1.2 概率論基礎(chǔ)與重要結(jié)論 19 【應(yīng)知應(yīng)會】MATLAB中概率論基本命令 21 1.2 機器學習基礎(chǔ) 21 1.2.1 監(jiān)督學習 22 【應(yīng)知應(yīng)會】數(shù)據(jù)挖掘與機器學習 22 1.2.2 無監(jiān)督學習 23 【案例1-2】無監(jiān)督學習中的k-means聚類 24 1.3 神經(jīng)網(wǎng)絡(luò)基礎(chǔ) 26 1.3.1 生物神經(jīng)網(wǎng)絡(luò) 26 【認知提升】探索初級視覺皮層的啟示 26 1.3.2 人工神經(jīng)網(wǎng)絡(luò)與神經(jīng)元模型 27 【知識擴容】Walter Pitts其人 27 1.4 最優(yōu)化理論基礎(chǔ) 28 1.4 1 最優(yōu)化問題 29 1.4.2 多目標優(yōu)化問題 30 1.4.3 群智能優(yōu)化方法 31 【案例1-3】指揮群智能團隊逐漸逼近問題最優(yōu)解 32 1.5 溫故知新 35 1.6 停下來,思考一下 36 第2章神經(jīng)網(wǎng)絡(luò)原理與實現(xiàn) 38 2.1 線性問題與感知機 38 2.2 多層前饋神經(jīng)網(wǎng)絡(luò)與BP算法 41 2.2.1 多層前饋神經(jīng)網(wǎng)絡(luò) 41 【案例2-1】具有異或邏輯的感知機 42 2.2.2 多層前饋神經(jīng)網(wǎng)絡(luò)的訓練 43 【案例2-2】訓練前饋神經(jīng)網(wǎng)絡(luò) 47 【應(yīng)知應(yīng)會】梯度下降算法 47 2.3 其他神經(jīng)網(wǎng)絡(luò) 48 2.3.1 徑向基函數(shù)網(wǎng)絡(luò) 48 2.3.2 自組織映射網(wǎng)絡(luò) 49 【案例2-3】用SOM網(wǎng)絡(luò)聚類Iris數(shù)據(jù) 49 2.3.3 深度神經(jīng)網(wǎng)絡(luò) 50 2.4 溫故知新 53 2.5 停下來,思考一下 53 第2篇深度學習方法論解析篇 第3章卷積神經(jīng)網(wǎng)絡(luò)(CNN) 58 3.1 卷積神經(jīng)網(wǎng)絡(luò)入門 58 3.1.1 生物機理 59 3.1.2 拓撲結(jié)構(gòu) 61 【知識擴容】圖像處理中的全連接網(wǎng)絡(luò)與卷積網(wǎng)絡(luò) 63 3.1.3 卷積神經(jīng)網(wǎng)絡(luò)的特點 63 3.2 卷積神經(jīng)網(wǎng)絡(luò)的關(guān)鍵技術(shù) 64 3.2.1 卷積 65 【案例3-1】利用圖像的卷積操作對66的單通道圖像進行瘦身 66 【知識擴容】多通道卷積 67 【案例3-2】構(gòu)建基本CNN 68 【認知提升】不同角度看卷積 68 3.2.2 池化 69 【最佳實踐】小技巧總結(jié) 71 【案例3-3】在Keras框架中實現(xiàn)MaxPooling 71 【知識擴容】VGG卷積神經(jīng)網(wǎng)絡(luò) 72 【案例3-4】揭開VGG和GoogLeNet的廬山真面目 73 【認知提升】GoogleNet的Inception結(jié)構(gòu) 75 3.2.3 扁平化 75 【案例3-5】實現(xiàn)圖像特征矩陣的扁平化操作 76 3.2.4 關(guān)鍵技術(shù)小結(jié) 76 【新觀點】卷積神經(jīng)網(wǎng)絡(luò)發(fā)展方向 77 3.3 綜合案例:三步教你構(gòu)建手寫字識別神經(jīng)網(wǎng)絡(luò) 78 【應(yīng)知應(yīng)會】Adam優(yōu)化算法 79 【知識擴容】CNN在自然語言處理中的應(yīng)用 81 3.4 溫故知新 82 3.5 停下來,思考一下 82 第4章生成式對抗網(wǎng)絡(luò)(GAN) 84 4.1 生成式對抗網(wǎng)絡(luò)基本原理 84 4.1.1 GAN的核心思想 84 【認知提升】GAN與博弈理論 85 4.1.2 GAN數(shù)學描述 86 【認知提升】囚徒困境博弈模型 86 4.1.3 GAN的網(wǎng)絡(luò)結(jié)構(gòu)與核心技術(shù) 87 4.1.4 GAN的改進模型 90 【案例4-1】ACGAN基于TensorFlow框架的實現(xiàn)(圖像為6464單通道數(shù)據(jù)) 91 【認知提升】博弈理論與多目標優(yōu)化 98 4.2 GAN應(yīng)用 99 4.2.1 數(shù)據(jù)缺失 100 4.2.2 多標簽預(yù)測 101 4.2.3 根據(jù)環(huán)境生成相應(yīng)數(shù)據(jù) 102 4.2.4 數(shù)據(jù)特征表示 103 4.2.5 圖像檢索 104 4.2.6 文本到圖像翻譯 104 4.2.7 醫(yī)學方面 105 4.3 綜合案例:動手構(gòu)建生成式對抗網(wǎng)絡(luò) 106 4.3.1 基于MATLAB的GAN 106 4.3.2 基于TensorFlow的GAN 108 4.4 溫故知新 115 4.5 停下來,思考一下 115 第5章循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN) 117 5.1 循環(huán)神經(jīng)網(wǎng)絡(luò)基本原理 117 5.1.1 問題背景 118 【案例5-1】詞性標注(我學習循環(huán)神經(jīng)網(wǎng)絡(luò)) 118 【應(yīng)知應(yīng)會】one-hot編碼 119 【認知提升】神經(jīng)網(wǎng)絡(luò)的記憶問題 120 5.1.2 循環(huán)神經(jīng)網(wǎng)絡(luò)基本思想 120 【最佳實踐】RNN的梯度爆炸和消失問題 123 5.2 LSTM網(wǎng)絡(luò)基本原理 124 5.2.1 LSTM的關(guān)鍵技術(shù) 124 【知識擴容】遞歸神經(jīng)網(wǎng)絡(luò)(Recursive Neural Network,RNN) 128 5.2.2 LSTM的應(yīng)用 128 【應(yīng)知應(yīng)會】自然語言處理 129 5.3 綜合案例:基于LSTM的語音預(yù)測 130 5.3.1 加載數(shù)據(jù) 130 5.3.2 定義網(wǎng)絡(luò)結(jié)構(gòu) 130 5.3.3 網(wǎng)絡(luò)訓練及評估 131 【應(yīng)知應(yīng)會】深度學習代碼一般結(jié)構(gòu) 132 5.4 綜合案例:基于循環(huán)神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別 132 5.4.1 數(shù)據(jù)準備及參數(shù)設(shè)置 132 5.4.2 網(wǎng)絡(luò)構(gòu)建 133 5.4.3 網(wǎng)絡(luò)訓練 134 5.5 綜合案例:基于LSTM的自然語言處理 135 5.5.1 數(shù)據(jù)收集及編碼 135 5.5.2 構(gòu)建LSTM模型 136 5.5.3 模型訓練 137 5.5 溫故知新 137 5.6 停下來,思考一下 138 第3篇深度學習實戰(zhàn)篇 第6章深度學習主流工具及框架 142 6.1 MATLAB基本語法與深度學習工具箱 142 6.1.1 MATLAB簡介 142 6.1.2 MATLAB安裝 143 6.1.3 MATLAB常用語法 146 6.1.4 基于MATLAB的深度學習工具箱 149 【案例6-1】基于MATLAB的AlexNet模型初探 151 【案例6-2】用安裝好的深度學習工具箱中的卷積神經(jīng)網(wǎng)絡(luò)做mnist 手寫數(shù)字識別,來驗證工具箱的有效性 152 6.2 Python基本語法、庫與開發(fā)工具 153 6.2.1 Python簡介 153 6.2.2 Python安裝 153 6.2.3 Python常用語法 155 【應(yīng)知應(yīng)會】Python常見錯誤提示及原因 156 6.2.4 常用Python庫 157 6.2.5 常用Python開發(fā)工具 161 【知識擴容】PyCharm常用快捷鍵 162 【案例6-3】Python送你圣誕帽 163 6.3 Caffe框架及環(huán)境搭建 165 6.3.1 Caffe簡介 165 6.3.2 Caffe環(huán)境搭建 166 【案例6-4】手寫體數(shù)字識別 167 6.4 TensorFlow框架及環(huán)境搭建 167 6.4.1 TensorFlow簡介 167 6.4.2 TensorFlow與Keras框架的關(guān)系 168 6.4.3 Windows 10上TensorFlow的環(huán)境搭建 169 6.5 其他常用框架 177 6.5.1 微軟CNTK 177 6.5.2 MXNet 178 6.5.3 Torch 178 6.5.4 Theano 179 6.6 溫故知新 180 6.7 停下來,思考一下 180 第7章 AlexNet關(guān)鍵技術(shù)與實戰(zhàn) 182 7.1 剖析AlexNet網(wǎng)絡(luò)結(jié)構(gòu) 182 【知識擴容】ImageNet與李飛飛 186 7.2 AlexNet關(guān)鍵技術(shù) 187 7.2.1 ReLU激活函數(shù) 187 7.2.2 標準化 187 【應(yīng)知應(yīng)會】激活函數(shù)的飽和與不飽和 188 【認知提升】馬太效應(yīng)、二八定律、長尾理論 188 7.2.3 Dropout 189 7.2.4 多GPU 190 【應(yīng)知應(yīng)會】CUDA 190 7.3 AlexNet與LeNet對比 191 7.4 CNN通用架構(gòu) 191 7.5 綜合案例:基于AlexNet的深度學習實戰(zhàn) 192 7.5.1 靜態(tài)圖像分類 192 7.5.2 用AlexNet做特征提。╢eature extraction) 194 7.5.3 用AlexNet做遷移學習 197 7.5.4 卷積神經(jīng)網(wǎng)絡(luò)的特征可視化 200 7.6 溫故知新 209 7.7 停下來,思考一下 210 第8章將手寫體識別進行到底 211 8.1 手寫體識別江湖地位 211 8.2 手寫數(shù)字識別 212 8.2.1 手寫數(shù)字的無監(jiān)督學習 213 【應(yīng)知應(yīng)會】稀疏表示 213 【應(yīng)知應(yīng)會】無監(jiān)督學習中的自動編碼器 219 8.2.2 手寫數(shù)字的全連接神經(jīng)網(wǎng)絡(luò)識別 219 【應(yīng)知應(yīng)會】softmax函數(shù)介紹 220 【認知提升】熵 220 8.2.3 手寫數(shù)字的卷積神經(jīng)網(wǎng)絡(luò)識別 221 8.3 手寫漢字識別 229 8.3.1 數(shù)據(jù)讀取及預(yù)處理 229 【最佳實踐】數(shù)據(jù)讀取 231 8.3.2 卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建 231 8.3.3 網(wǎng)絡(luò)模型訓練及結(jié)果可視化 233 8.4 綜合案例:手寫數(shù)字旋轉(zhuǎn)角度識別 234 8.4.1 數(shù)據(jù)載入 235 8.4.2 網(wǎng)絡(luò)構(gòu)建 235 8.4.3 網(wǎng)絡(luò)訓練 236 8.4.4 測試預(yù)測精度 236 8.4.5 殘差展示 237 8.4.6 偏轉(zhuǎn)角度矯正及可視化 237 8.5 溫故知新 238 8.6 停下來,思考一下 239 第9章基于深度學習的視頻檢測 240 9.1 人物監(jiān)控視頻問題研究意義及現(xiàn)狀 240 9.1.1 研究意義 240 9.1.2 國內(nèi)外研究現(xiàn)狀 242 9.2 研究情況介紹 244 9.2.1 研究內(nèi)容 244 9.2.2 研究目標及關(guān)鍵科學問題 244 【案例9-1】基于Python庫的人臉識別 245 9.3 綜合案例:基于深度學習的人臉視頻檢測 247 9.3.1 環(huán)境準備 247 9.3.2 數(shù)據(jù)處理 248 9.3.3 模型訓練 250 9.3.4 監(jiān)控代碼 255 9.4 綜合案例:基于深度學習的物體視頻檢測 256 9.4.1 AlexNet回顧 256 9.4.2 入門版 257 9.4.3 初級版 258 9.4.4 加強版 259 9.4.5 升級版 260 9.4.6 豪華版 261 【案例9-2】讓手機當網(wǎng)絡(luò)攝像頭 262 9.5 溫故知新 262 9.6 停下來,思考一下 263 第10章基于深度學習的信息隱藏 264 10.1 數(shù)字圖像隱寫分析研究現(xiàn)狀及意義 264 10.1.1 研究意義 267 10.1.2 研究現(xiàn)狀 268 10.1.3 潛在的應(yīng)用 268 10.2 數(shù)字圖像隱寫分析概述 270 【案例10-1】基于四叉樹編碼的空間域高保真可逆信息隱藏 271 10.3 基于ACGAN的無載體信息隱藏 272 10.3.1 生成式對抗網(wǎng)絡(luò)回顧 272 【應(yīng)知應(yīng)會】零和博弈 272 10.3.2 基于ACGAN的信息隱藏關(guān)鍵技術(shù) 274 10.4 綜合案例:ACGAN信息隱藏實戰(zhàn) 276 10.4.1 方案概述 276 【認知提升】可逆信息隱藏 277 10.4.2 隱藏算法與提取算法的實現(xiàn) 278 10.4.3 性能分析 286 10.4.3 可靠性 287 10.4.4 安全性 287 10.5 溫故知新 288 1
你還可能感興趣
我要評論
|