Python機(jī)器學(xué)習(xí):基礎(chǔ)、算法與實(shí)戰(zhàn)
定 價(jià):99 元
- 作者:孫玉林 編著
- 出版時(shí)間:2023/10/1
- ISBN:9787122435347
- 出 版 社:化學(xué)工業(yè)出版社
- 中圖法分類(lèi):TP311.561
- 頁(yè)碼:312
- 紙張:
- 版次:01
- 開(kāi)本:小16開(kāi)
本書(shū)基于Python語(yǔ)言,結(jié)合實(shí)際的數(shù)據(jù)集,介紹了機(jī)器學(xué)習(xí)算法以及數(shù)據(jù)分析方法的應(yīng)用。本書(shū)主要包含兩部分內(nèi)容,第一部分為Python機(jī)器學(xué)習(xí)入門(mén)知識(shí):主要介紹了Python的基礎(chǔ)內(nèi)容、Numpy與Pandas庫(kù)數(shù)據(jù)操作、Matplotlib與Seaborn庫(kù)數(shù)據(jù)可視化、Sklearn庫(kù)機(jī)器學(xué)習(xí),以及與機(jī)器學(xué)習(xí)相關(guān)的基礎(chǔ)知識(shí);第二部分為Python機(jī)器學(xué)習(xí)算法應(yīng)用:主要介紹了數(shù)據(jù)的回歸預(yù)測(cè)分析、時(shí)間序列預(yù)測(cè),數(shù)據(jù)無(wú)監(jiān)督學(xué)習(xí)中的聚類(lèi)、降維以及關(guān)聯(lián)規(guī)則,數(shù)據(jù)分類(lèi)模型的應(yīng)用以及針對(duì)文本數(shù)據(jù)與網(wǎng)絡(luò)圖數(shù)據(jù)的機(jī)器學(xué)習(xí)算法應(yīng)用。
本書(shū)適合對(duì)機(jī)器學(xué)習(xí)、數(shù)據(jù)分析感興趣的初學(xué)者學(xué)習(xí),也可作為Python機(jī)器學(xué)習(xí)、數(shù)據(jù)分析、數(shù)據(jù)可視化的入門(mén)及進(jìn)階的教材。
第1章 Python機(jī)器學(xué)習(xí)快速入門(mén) 1
1.1 Python安裝 1
1.1.1 安裝Anaconda 1
1.1.2 安裝Python庫(kù) 5
1.2 Python常用數(shù)據(jù)類(lèi)型 5
1.2.1 列表 5
1.2.2 元組 8
1.2.3 字典 9
1.2.4 集合 10
1.2.5 字符串 11
1.3 Python條件、循環(huán)與函數(shù) 13
1.3.1 條件判斷語(yǔ)句 13
1.3.2 循環(huán)語(yǔ)句 14
1.3.3 函數(shù) 16
1.4 機(jī)器學(xué)習(xí)簡(jiǎn)介 17
1.4.1 無(wú)監(jiān)督學(xué)習(xí) 18
1.4.2 有監(jiān)督學(xué)習(xí) 20
1.4.3 半監(jiān)督學(xué)習(xí) 21
1.4.4 常用機(jī)器學(xué)習(xí)算法 22
1.5 本章小結(jié) 22
第2章 Python中的常用庫(kù) 23
2.1 Numpy庫(kù) 23
2.1.1 Numpy數(shù)組生成 24
2.1.2 Numpy數(shù)組運(yùn)算 27
2.1.3 Numpy數(shù)組操作 28
2.1.4 Numpy常用函數(shù) 33
2.2 Pandas庫(kù) 36
2.2.1 Pandas數(shù)據(jù)生成和讀取 37
2.2.2 Pandas數(shù)據(jù)操作 39
2.2.3 Pandas數(shù)據(jù)可視化 44
2.3 Matplotlib庫(kù) 47
2.3.1 Matplotlib可視化基礎(chǔ) 47
2.3.2 Matplotlib數(shù)據(jù)可視化實(shí)戰(zhàn) 53
2.4 Seaborn庫(kù) 60
2.4.1 Seaborn庫(kù)功能簡(jiǎn)介 60
2.4.2 Seaborn庫(kù)數(shù)據(jù)可視化實(shí)戰(zhàn) 61
2.5 Sklearn庫(kù) 65
2.5.1 Sklearn庫(kù)功能簡(jiǎn)介 65
2.5.2 Sklearn庫(kù)應(yīng)用實(shí)戰(zhàn) 66
2.6 本章小結(jié) 70
第3章 機(jī)器學(xué)習(xí)流程 71
3.1 數(shù)據(jù)預(yù)處理與探索 72
3.1.1 缺失值處理 73
3.1.2 數(shù)據(jù)可視化探索 74
3.1.3 數(shù)據(jù)標(biāo)準(zhǔn)化與變換 78
3.2 無(wú)監(jiān)督問(wèn)題應(yīng)用 81
3.2.1 數(shù)據(jù)降維 81
3.2.2 數(shù)據(jù)聚類(lèi) 84
3.3 有監(jiān)督分類(lèi)問(wèn)題應(yīng)用 87
3.4 有監(jiān)督回歸問(wèn)題應(yīng)用 91
3.5 半監(jiān)督學(xué)習(xí)應(yīng)用 94
3.6 本章小結(jié) 96
第4章 模型的選擇與評(píng)估 98
4.1 模型的選擇 98
4.1.1 模型擬合情況 98
4.1.2 避免欠擬合和過(guò)擬合的方式 100
4.1.3 模型的方差與偏差 101
4.2 模型訓(xùn)練技巧 101
4.2.1 相關(guān)方法 102
4.2.2 實(shí)戰(zhàn)案例:K折交叉驗(yàn)證 103
4.2.3 實(shí)戰(zhàn)案例:參數(shù)網(wǎng)格搜索 104
4.3 模型評(píng)價(jià)指標(biāo) 106
4.3.1 分類(lèi)效果評(píng)價(jià) 106
4.3.2 回歸效果評(píng)價(jià) 106
4.3.3 聚類(lèi)效果評(píng)價(jià) 107
4.4 本章小結(jié) 108
第5章 回歸模型 109
5.1 一元線性回歸 111
5.1.1 模型介紹 111
5.1.2 實(shí)戰(zhàn)案例:一元線性回歸建模 111
5.2 多元線性回歸 116
5.2.1 模型簡(jiǎn)介 116
5.2.2 實(shí)戰(zhàn)案例:房屋價(jià)格預(yù)測(cè) 116
5.3 正則化Lasso回歸 127
5.3.1 模型簡(jiǎn)介 127
5.3.2 實(shí)戰(zhàn)案例:Lasso回歸預(yù)測(cè)房屋價(jià)格 128
5.4 時(shí)間序列ARIMA模型 133
5.4.1 模型簡(jiǎn)介 133
5.4.2 實(shí)戰(zhàn)案例:ARIMA模型預(yù)測(cè)未來(lái)啤酒消耗量 134
5.5 時(shí)間序列SARIMA模型 145
5.5.1 模型簡(jiǎn)介 145
5.5.2 實(shí)戰(zhàn)案例:SARIMA模型預(yù)測(cè)未來(lái)啤酒消耗量 146
5.6 本章小結(jié) 149
第6章 無(wú)監(jiān)督模型 150
6.1 常用降維算法 151
6.1.1 主成分分析 151
6.1.2 因子分析 152
6.1.3 流形學(xué)習(xí)——等距映射 152
6.1.4 局部線性嵌入LLE 153
6.1.5 多維尺度變換MSD 153
6.1.6 t-SNE 153
6.2 數(shù)據(jù)降維案例實(shí)戰(zhàn) 154
6.2.1 主成分分析數(shù)據(jù)降維 156
6.2.2 因子分析數(shù)據(jù)降維 159
6.2.3 流形學(xué)習(xí)——等距嵌入數(shù)據(jù)降維 160
6.2.4 局部線性嵌入數(shù)據(jù)降維 161
6.2.5 MDS數(shù)據(jù)降維 162
6.2.6 t-SNE數(shù)據(jù)降維 163
6.3 常用聚類(lèi)算法 164
6.3.1 K均值聚類(lèi) 165
6.3.2 密度聚類(lèi) 165
6.3.3 系統(tǒng)聚類(lèi) 166
6.3.4 模糊聚類(lèi) 167
6.4 數(shù)據(jù)聚類(lèi)案例實(shí)戰(zhàn) 168
6.4.1 K均值聚類(lèi)實(shí)戰(zhàn) 169
6.4.2 密度聚類(lèi)實(shí)戰(zhàn) 173
6.4.3 系統(tǒng)聚類(lèi)實(shí)戰(zhàn) 175
6.4.4 模糊聚類(lèi)實(shí)戰(zhàn) 178
6.5 關(guān)聯(lián)規(guī)則挖掘 179
6.5.1 模型簡(jiǎn)介 180
6.5.2 實(shí)戰(zhàn)案例:購(gòu)物籃分析 181
6.6 本章小結(jié) 188
第7章 分類(lèi)模型 189
7.1 決策樹(shù)算法 193
7.1.1 算法簡(jiǎn)介 193
7.1.2 實(shí)戰(zhàn)案例:決策樹(shù)算法實(shí)戰(zhàn) 195
7.2 隨機(jī)森林算法 203
7.2.1 算法介紹 203
7.2.2 實(shí)戰(zhàn)案例:隨機(jī)森林算法實(shí)戰(zhàn) 203
7.3 Logistic回歸算法 208
7.3.1 算法簡(jiǎn)介 208
7.3.2 實(shí)戰(zhàn)案例:Logistic回歸算法實(shí)戰(zhàn) 209
7.4 支持向量機(jī)算法 211
7.4.1 算法簡(jiǎn)介 211
7.4.2 實(shí)戰(zhàn)案例:支持向量機(jī)算法實(shí)戰(zhàn) 213
7.5 人工神經(jīng)網(wǎng)絡(luò)算法 219
7.5.1 算法簡(jiǎn)介 219
7.5.2 人工神經(jīng)網(wǎng)絡(luò)算法實(shí)戰(zhàn) 221
7.6 本章小結(jié) 225
第8章 高級(jí)數(shù)據(jù)回歸算法 226
8.1 高級(jí)數(shù)據(jù)回歸算法模型實(shí)戰(zhàn) 227
8.1.1 數(shù)據(jù)探索與可視化 227
8.1.2 隨機(jī)森林回歸預(yù)測(cè)實(shí)戰(zhàn) 232
8.1.3 GBDT回歸預(yù)測(cè)實(shí)戰(zhàn) 234
8.1.4 支持向量機(jī)回歸預(yù)測(cè)實(shí)戰(zhàn) 236
8.1.5 人工神經(jīng)網(wǎng)絡(luò)回歸預(yù)測(cè)實(shí)戰(zhàn) 237
8.2 復(fù)雜時(shí)間序列預(yù)測(cè)模型 239
8.2.1 Prophet時(shí)序回歸 239
8.2.2 多元時(shí)序回歸 240
8.3 時(shí)間序列回歸模型實(shí)戰(zhàn) 240
8.3.1 時(shí)序數(shù)據(jù)導(dǎo)入與可視化探索 240
8.3.2 Prophet算法預(yù)測(cè)用戶(hù)數(shù)量 242
8.3.3 Prophet算法預(yù)測(cè)流量 245
8.3.4 VAR多變量時(shí)間序列的建模與預(yù)測(cè) 247
8.3.5 VARMA多變量時(shí)間序列的建模與預(yù)測(cè) 250
8.4 本章小結(jié) 253
第9章 非結(jié)構(gòu)數(shù)據(jù)機(jī)器學(xué)習(xí) 254
9.1 非結(jié)構(gòu)數(shù)據(jù)分析簡(jiǎn)介 255
9.1.1 文本數(shù)據(jù)分析簡(jiǎn)介 255
9.1.2 網(wǎng)絡(luò)圖數(shù)據(jù)分析簡(jiǎn)介 256
9.2 文本數(shù)據(jù)分析實(shí)戰(zhàn) 257
9.2.1 文本數(shù)據(jù)預(yù)處理 257
9.2.2 文本獲取TF-IDF特征 263
9.2.3 文本數(shù)據(jù)K均值聚類(lèi) 265
9.2.4 文本數(shù)據(jù)LDA主題模型 266
9.2.5 文本數(shù)據(jù)樸素貝葉斯分類(lèi) 267
9.3 網(wǎng)絡(luò)圖數(shù)據(jù)分析實(shí)戰(zhàn) 272
9.3.1 網(wǎng)絡(luò)圖可視化 272
9.3.2 網(wǎng)絡(luò)圖聚類(lèi)分割 277
9.4 本章小結(jié) 281
第10章 綜合實(shí)戰(zhàn)案例:中藥材鑒別 282
10.1 無(wú)監(jiān)督學(xué)習(xí)——鑒別藥材種類(lèi) 284
10.1.1 數(shù)據(jù)特征可視化探索 285
10.1.2 使用原始特征進(jìn)行聚類(lèi)分析 287
10.1.3 使用降維后的特征進(jìn)行聚類(lèi) 291
10.2 有監(jiān)督學(xué)習(xí)——藥材產(chǎn)地鑒別 295
10.2.1 數(shù)據(jù)特征可視化探索分析 296
10.2.2 利用選擇的特征進(jìn)行分類(lèi) 297
10.3 半監(jiān)督學(xué)習(xí)——藥材類(lèi)別鑒別 303
10.3.1 數(shù)據(jù)預(yù)處理和可視化探索 304
10.3.2 數(shù)據(jù)主成分分析降維 306
10.3.3 半監(jiān)督學(xué)習(xí)分類(lèi)——標(biāo)簽傳播算法 308
10.4 本章小結(jié) 311
參考文獻(xiàn) 312