機(jī)器學(xué)習(xí)中的概率統(tǒng)計(jì)——Python語言描述
定 價:79 元
叢書名:智能系統(tǒng)與技術(shù)叢書
- 作者:張雨萌
- 出版時間:2020/12/1
- ISBN:9787111669357
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP181
- 頁碼:0
- 紙張:
- 版次:
- 開本:32開
內(nèi)容簡介
本書圍繞機(jī)器學(xué)習(xí)算法中涉及的概率統(tǒng)計(jì)知識展開介紹,沿著概率思想、變量分布、參數(shù)估計(jì)、隨機(jī)過程和統(tǒng)計(jì)推斷的知識主線進(jìn)行講解,結(jié)合數(shù)學(xué)的本質(zhì)內(nèi)涵,用淺顯易懂的語言講透深刻的數(shù)學(xué)思想,幫助讀者構(gòu)建理論體系。同時,作者在講解的過程中注重應(yīng)用場景的延伸,并利用Python工具無縫對接工程應(yīng)用,幫助讀者學(xué)以致用。
?全書共5章。
?第1章以條件概率和獨(dú)立性作為切入點(diǎn),幫助讀者建立認(rèn)知概率世界的正確視角。
?第2章介紹隨機(jī)變量的基礎(chǔ)概念和重要分布類型,并探討多元隨機(jī)變量間的重要關(guān)系。
?第3章介紹極限思維以及蒙特卡羅方法,并重點(diǎn)分析極大似然估計(jì)方法以及有偏無偏等重要性質(zhì),*后拓展到含有隱變量的參數(shù)估計(jì)問題,介紹EM算法的原理及其應(yīng)用。
?第4章由靜態(tài)的隨機(jī)變量過渡到動態(tài)的隨機(jī)過程,重點(diǎn)介紹馬爾可夫過程和隱馬爾可夫模型。
?第5章聚焦馬爾可夫鏈-蒙特卡羅方法,并列舉實(shí)例展示Metropolis-Hastings和Gibbs的具體采樣過程。
序
前言
第1章 概率思想:構(gòu)建理論基礎(chǔ)1
1.1 理論基石:條件概率、獨(dú)立性與貝葉斯1
1.1.1 從概率到條件概率1
1.1.2 條件概率的具體描述2
1.1.3 條件概率的表達(dá)式分析3
1.1.4 兩個事件的獨(dú)立性4
1.1.5 從條件概率到全概率公式5
1.1.6 聚焦貝葉斯公式6
1.1.7 本質(zhì)內(nèi)涵:由因到果,由果推因7
1.2 事件的關(guān)系:深入理解獨(dú)立性8
1.2.1 重新梳理兩個事件的獨(dú)立性8
1.2.2 不相容與獨(dú)立性8
1.2.3 條件獨(dú)立9
1.2.4 獨(dú)立與條件獨(dú)立11
1.2.5 獨(dú)立重復(fù)實(shí)驗(yàn)11
第2章 變量分布:描述隨機(jī)世界13
2.1 離散型隨機(jī)變量:分布與數(shù)字特征13
2.1.1 從事件到隨機(jī)變量13
2.1.2 離散型隨機(jī)變量及其要素14
2.1.3 離散型隨機(jī)變量的分布列15
2.1.4 分布列和概率質(zhì)量函數(shù)16
2.1.5 二項(xiàng)分布及二項(xiàng)隨機(jī)變量17
2.1.6 幾何分布及幾何隨機(jī)變量21
2.1.7 泊松分布及泊松隨機(jī)變量24
2.2 連續(xù)型隨機(jī)變量:分布與數(shù)字特征27
2.2.1 概率密度函數(shù)27
2.2.2 連續(xù)型隨機(jī)變量區(qū)間概率的計(jì)算29
2.2.3 連續(xù)型隨機(jī)變量的期望與方差29
2.2.4 正態(tài)分布及正態(tài)隨機(jī)變量30
2.2.5 指數(shù)分布及指數(shù)隨機(jī)變量33
2.2.6 均勻分布及其隨機(jī)變量35
2.3 多元隨機(jī)變量(上):聯(lián)合、邊緣與條件38
2.3.1 實(shí)驗(yàn)中引入多個隨機(jī)變量38
2.3.2 聯(lián)合分布列38
2.3.3 邊緣分布列39
2.3.4 條件分布列40
2.3.5 集中梳理核心的概率理論44
2.4 多元隨機(jī)變量(下):獨(dú)立與相關(guān)46
2.4.1 隨機(jī)變量與事件的獨(dú)立性46
2.4.2 隨機(jī)變量之間的獨(dú)立性47
2.4.3 獨(dú)立性示例48
2.4.4 條件獨(dú)立的概念48
2.4.5 獨(dú)立隨機(jī)變量的期望和方差50
2.4.6 隨機(jī)變量的相關(guān)性分析及量化方法52
2.4.7 協(xié)方差及協(xié)方差矩陣52
2.4.8 相關(guān)系數(shù)的概念54
2.5 多元隨機(jī)變量實(shí)踐:聚焦多元正態(tài)分布55
2.5.1 再談相關(guān)性:基于二元標(biāo)準(zhǔn)正態(tài)分布55
2.5.2 二元一般正態(tài)分布57
2.5.3 聚焦相關(guān)系數(shù)60
2.5.4 獨(dú)立和相關(guān)性的關(guān)系64
2.6 多元高斯分布:參數(shù)特征和幾何意義66
2.6.1 從一元分布到多元分布66
2.6.2 多元高斯分布的參數(shù)形式67
2.6.3 二元高斯分布的具體示例68
2.6.4 多元高斯分布的幾何特征71
2.6.5 二元高斯分布幾何特征實(shí)例分析74
第3章 參數(shù)估計(jì):探尋最大可能77
3.1 極限思維:大數(shù)定律與中心極限定理77
3.1.1 一個背景話題77
3.1.2 大數(shù)定律78
3.1.3 大數(shù)定律的模擬80
3.1.4 中心極限定理83
3.1.5 中心極限定理的工程意義84
3.1.6 中心極限定理的模擬85
3.1.7 大數(shù)定律的應(yīng)用:蒙特卡羅方法86
3.2 推斷未知:統(tǒng)計(jì)推斷的基本框架89
3.2.1 進(jìn)入統(tǒng)計(jì)學(xué)89
3.2.2 統(tǒng)計(jì)推斷的例子90
3.2.3 統(tǒng)計(jì)推斷中的一些重要概念91
3.2.4 估計(jì)量的偏差與無偏估計(jì)92
3.2.5 總體均值的估計(jì)93
3.2.6 總體方差的估計(jì)95
3.3 極大似然估計(jì)100
3.3.1 極大似然估計(jì)法的引例100
3.3.2 似然函數(shù)的由來102
3.3.3 極大似然估計(jì)的思想103
3.3.4 極大似然估計(jì)值的計(jì)算105
3.3.5 簡單極大似然估計(jì)案例106
3.3.6 高斯分布參數(shù)的極大似然估計(jì)107
3.4 含有隱變量的參數(shù)估計(jì)問題110
3.4.1 參數(shù)估計(jì)問題的回顧110
3.4.2 新情況:場景中含有隱變量111
3.4.3 迭代法:解決含有隱變量情形的拋硬幣問題112
3.4.4 代碼實(shí)驗(yàn)115
3.5 概率漸增:EM算法的合理性118
3.5.1 EM算法的背景介紹119
3.5.2 先拋出EM算法的迭代公式119
3.5.3 EM算法為什么是有效的120
3.6 探索EM公式的底層邏輯與由來123
3.6.1 EM公式中的E步和M步124
3.6.2 剖析EM算法的由來124
3.7 探索高斯混合模型:EM 迭代實(shí)踐127
3.7.1 高斯混合模型的引入128
3.7.2 從混合模型的角度看內(nèi)部機(jī)理129
3.7.3 高斯混合模型的參數(shù)估計(jì)131
3.8 高斯混合模型的參數(shù)求解132
3.8.1 利用 EM 迭代模型參數(shù)的思路132
3.8.2 參數(shù)估計(jì)示例136
3.8.3 高斯混合模型的應(yīng)用場景139
第4章 隨機(jī)過程:聚焦動態(tài)特征145
4.1 由靜向動:隨機(jī)過程導(dǎo)引145
4.1.1 隨機(jī)過程場景舉例1:博彩146
4.1.2 隨機(jī)過程場景舉例2:股價的變化150
4.1.3 隨機(jī)過程場景舉例3:股價變化過程的展現(xiàn)152
4.1.4 兩類重要的隨機(jī)過程概述154
4.2 狀態(tài)轉(zhuǎn)移:初識馬爾可夫鏈155
4.2.1 馬爾可夫鏈三要素155
4.2.2 馬爾可夫性:靈魂特征156
4.2.3 轉(zhuǎn)移概率和狀態(tài)轉(zhuǎn)移矩陣157
4.2.4 馬爾可夫鏈性質(zhì)的總結(jié)158
4.2.5 一步到達(dá)與多步轉(zhuǎn)移的含義159
4.2.6 多步轉(zhuǎn)移與矩陣乘法160
4.2.7 路徑概率問題163
4.3 變與不變:馬爾可夫鏈的極限與穩(wěn)態(tài)164
4.3.1 極限與初始狀態(tài)無關(guān)的情況164
4.3.2 極限依賴于初始狀態(tài)的情況165
4.3.3 吸收態(tài)與收斂分析167
4.3.4 可達(dá)與常返168
4.3.5 周期性問題171
4.3.6 馬爾可夫鏈的穩(wěn)態(tài)分析和判定172
4.3.7 穩(wěn)態(tài)的求法174
4.4 隱馬爾可夫模型:明暗兩條線176
4.4.1 從馬爾可夫鏈到隱馬爾可夫模型176
4.4.2 典型實(shí)例1:盒子摸球?qū)嶒?yàn)177
4.4.3 典型實(shí)例2:小寶寶的日常生活180
4.4.4 隱馬爾可夫模型的外在表征181
4.4.5 推動模型運(yùn)行的內(nèi)核三要素182
4.4.6 關(guān)鍵性質(zhì):齊次馬爾可夫性和觀測獨(dú)立性183
4.5 概率估計(jì):隱馬爾可夫模型觀測序列描述183
4.5.1 隱馬爾可夫模型的研究內(nèi)容183
4.5.2 模型研究問題的描述185
4.5.3 一個直觀的思路186
4.5.4 更優(yōu)的方法:前向概率算法187
4.5.5 概率估計(jì)實(shí)踐190
4.5.6 代碼實(shí)踐192
4.6 狀態(tài)解碼:隱馬爾可夫模型隱狀態(tài)揭秘194
4.6.1 隱狀態(tài)解碼問題的描述194
4.6.2 最大路徑概率與維特比算法195
4.6.3 應(yīng)用維特比算法進(jìn)行解碼197
4.6.4 維特比算法的案例實(shí)踐199
4.6.5 代碼實(shí)踐202
4.7 連續(xù)域上的無限維:高斯過程204
4.7.1 高斯過程的一個實(shí)際例子205
4.7.2 高斯過程的核心要素和嚴(yán)謹(jǐn)描述206
4.7.3 徑向基函數(shù)的代碼演示207
4.7.4 高斯過程回歸原理詳解208
4.7.5 高斯過程回歸代碼演示210
第5章 統(tǒng)計(jì)推斷:貫穿近似策略215
5.1 統(tǒng)計(jì)推斷的基本思想和分類215
5.1.1 統(tǒng)計(jì)推斷的根源和場景215
5.1.2 后驗(yàn)分布:推斷過程的關(guān)注重點(diǎn)216
5.1.3 精確推斷和近似推斷216
5.1.4 確定性近似:變分推斷概述217
5.2 隨機(jī)近似方法219
5.2.1 蒙特卡羅方法的理論支撐219
5.2.2 隨機(jī)近似的核心:蒙特卡羅220
5.2.3 接受-拒絕采樣的問題背景221
5.2.4 接受-拒絕采樣的方法和步驟221
5.2.5 接受-拒絕采樣的實(shí)踐222
5.2.6 接受-拒絕采樣方法背后的內(nèi)涵挖掘225
5.2.7 重要性采樣226
5.2.8 兩種采樣方法的問題及思考227
5.3 采樣絕佳途徑:借助馬爾可夫鏈的穩(wěn)態(tài)性質(zhì)228
5.3.1 馬爾可夫鏈回顧228
5.3.2 核心:馬爾可夫鏈的平穩(wěn)分布229
5.3.3 馬爾可夫鏈進(jìn)入穩(wěn)態(tài)的轉(zhuǎn)移過程231
5.3.4 穩(wěn)態(tài)及轉(zhuǎn)移過程演示231
5.3.5 馬爾可夫鏈穩(wěn)態(tài)的價值和意義235
5.3.6 基于馬爾可夫鏈進(jìn)行采樣的原理分析236
5.3.7 采樣過程實(shí)踐與分析238
5.3.8 一個顯而易見的問題和難點(diǎn)242
5.4 馬爾可夫鏈-蒙特卡羅方法詳解242
5.4.1 穩(wěn)態(tài)判定:細(xì)致平穩(wěn)條件243
5.4.2 Metropolis-Hastings采樣方法的原理244
5.4.3 如何理解隨機(jī)游走疊加接受概率245
5.4.4 如何實(shí)現(xiàn)隨機(jī)游走疊加接受概率247
5.4.5 建議轉(zhuǎn)移概率矩陣Q的設(shè)計(jì)247
5.4.6 Metropolis-Hastings方法的步驟和代碼演示251
5.5 Gibbs采樣方法簡介253
5.5.1 Gibbs方法核心流程253
5.5.2 Gibbs采樣的合理性255
5.5.3 Gibbs采樣代碼實(shí)驗(yàn)256