丰满人妻一区二区三区无码AV,精品亚州aⅤ无码一区,yw5577亚洲播播在线

本書介紹在嵌入式系統(tǒng)中的機器學習算法優(yōu)化原理、設計方法及其實現(xiàn)技術。內容涵蓋通用嵌入式優(yōu)化技術，包括基于SIMD指令集的優(yōu)化、內存訪問模式優(yōu)化、參數(shù)量化等。并在此基礎上介紹了信號處理層面的優(yōu)化，包括AI推理算法及基于神經網絡的AI算法訓練-推理聯(lián)合的優(yōu)化理論與方法。其中信號處理層面優(yōu)化包括了基于線性代數(shù)的快速近似算法、基于多項式的快速卷積構造技術、基于數(shù)據(jù)二進制結構的快速乘法算法等；在AI推理層面，介紹了機器學習推理模型共性結構、運算圖中各個算子的計算優(yōu)化途徑；另外對基于神經網絡AI算法，闡述了如何將推理階段的運算量約束以及底層數(shù)據(jù)量化約束加入訓練代價函數(shù)，從算法訓練端減少運算量以提升AI嵌入式系統(tǒng)的運行效率；此外本書還通過多個自動搜索優(yōu)化參數(shù)并生成C代碼的例子介紹了通用的嵌入式環(huán)境下機器學習算法自動優(yōu)化和部署工具開發(fā)的基本知識；本書通過應用例子和大量代碼說明AI算法在通用嵌入式系統(tǒng)中的實現(xiàn)方法，力求讓讀者在理解算法的基礎上，通過實踐掌握高效的AI嵌入式系統(tǒng)開發(fā)的知識與技能。

隨著人工智能（AI）技術在各個行業(yè)的普及，將AI技術和嵌入式系統(tǒng)相結合，構建AI嵌入式系統(tǒng)成為當前技術熱點之一。本書介紹AI領域多種機器學習算法在嵌入式系統(tǒng)上的底層實現(xiàn)和優(yōu)化技術�，F(xiàn)在很多機器學習算法基于海量存儲和運算，對功耗、體積、計算能力和存儲容量有較高要求，而不同領域的嵌入式系統(tǒng)受限于各自的應用需求，難以滿足所有條件。目前在嵌入式系統(tǒng)中實現(xiàn)復雜機器學習算法有多條途徑，包括基于通用GPU多處理器架構的方案、基于專用運算加速引擎的定制化方案，以及基于現(xiàn)有處理器對算法進行深度優(yōu)化的方案等。這些技術方案各有優(yōu)缺點，并且在不同領域得到了應用�；贕PU的通用多處理器架構的方案通用性強、算力高，但代價是硬件成本高、功耗大�；趯Ｓ眠\算加速引擎的定制化方案運算效率高，功耗可控，但運算結構相對固定，靈活性差�；诂F(xiàn)有處理器對算法進行深度優(yōu)化的方案成本低，不需要專用或者定制化硬件，通用性強，但代價是需要手動對各案例逐個進行優(yōu)化，開發(fā)難度高。本書中關注的是基于現(xiàn)有的嵌入式處理器系統(tǒng)和架構，通過不同層次的優(yōu)化實現(xiàn)機器學習算法。雖然書中所介紹的方法以通用嵌入式處理器為例，但也能夠應用于GPU或者硬件加速引擎架構，比如基于變換域的快速卷積算法在GPU的底層運算庫中得到應用，基于加減圖的常數(shù)乘法運算能夠方便地在芯片硬件設計中實現(xiàn)。

機器學習涉及多個不同領域的算法，其中包括基于統(tǒng)計學習的方法和基于神經網絡的方法。基于統(tǒng)計學習的算法理論模型設計精巧，泛化性能好，運算量相對較低，容易在存儲量和運算量受限的嵌入式系統(tǒng)中實現(xiàn)，但它依賴較強的概率假設，模型上的偏差限制了它在實際應用中的性能。近年來，隨著GPU算力的增加以及海量標注數(shù)據(jù)的積累，基于神經網絡的灰盒式機器學習算法得到應用，神經網絡訓練使用反向梯度傳播算法，能夠自動地從訓練數(shù)據(jù)中學到特征提取方法，擺脫人工特征設計的效率約束。很多現(xiàn)有神經網絡性能優(yōu)越，但龐大的參數(shù)存儲量限制了其在嵌入式系統(tǒng)上的實現(xiàn)。近年來的研究發(fā)現(xiàn)，很多神經網絡架構中存在大量冗余的運算和參數(shù)，通過運算的簡化和架構裁剪能夠大大降低神經網絡對計算性能和內存的需求，使得在嵌入式系統(tǒng)上實現(xiàn)它成為可能。本書中討論的內容覆蓋基于統(tǒng)計學習和基于神經網絡的機器學習算法在嵌入式系統(tǒng)上的實現(xiàn)，通過算法和例程介紹具體的優(yōu)化手段。

書中給出了通過詳細的手工優(yōu)化步驟以說明嵌入式機器學習算法的優(yōu)化過程，但隨著機器學習算法復雜度的增加和規(guī)模的擴大，手動優(yōu)化效率顯得較低。對部分優(yōu)化過程，我們給出了軟件輔助優(yōu)化的介紹，比如通過軟件自動搜索加減圖實現(xiàn)多常數(shù)乘法，使用軟件控制神經網絡訓練過程，消除網絡參數(shù)和架構上的冗余，以及通過軟件自動從訓練得到的模型中提取參數(shù)并自動生成C語言源代碼。讀者可以基于這些代碼進一步拓展，構建自動化的嵌入式機器學習算法實現(xiàn)工具。在撰寫本書期間，出現(xiàn)了多種嵌入式機器學習算法框架和算法部署工具，大大提高了機器學習算法在嵌入式系統(tǒng)中的部署效率。從長遠看，使用更高層的機器學習算法來訓練和優(yōu)化當前機器學習算法會是研究趨勢。

書中介紹的部分底層算法代碼以Python語言形式給出，這考慮了Python語言的表達能力和程序簡潔性，在實際應用中需要讀者在理解算法原理的基礎上改成C程序實現(xiàn)。另外，書中列舉的機器學習問題集中在基本的手寫識別數(shù)據(jù)或者簡單圖像分類問題上，選擇這些機器學習問題，是考慮到它們的訓練速度快，模型構建代碼量小，能夠在有限篇幅內解釋清楚，但所介紹的方法能夠應用于更復雜的機器學習算法和模型。

機器學習涉及建模、訓練和推理這幾個部分，本書的重點在于嵌入式系統(tǒng)中的機器學習算法推理過程的實現(xiàn)，對機器學習本身的理論模型介紹相對較少，因此需要讀者在閱讀之前了解基本的機器學習算法知識。另外，要掌握本書介紹的近似算法，需要讀者提前了解一些線性代數(shù)的知識。

本書的撰寫工作得到了Arm中國大學計劃的幫助和支持，在此表示感謝！

應忍冬

2021年6月于上海

你還可能感興趣

我要評論