人工智能開發(fā)叢書--Python機器學(xué)習(xí)集錦
定 價:95 元
叢書名:人工智能開發(fā)叢書
- 作者:潘風(fēng)文、龐資勝 編著
- 出版時間:2023/7/1
- ISBN:9787122433923
- 出 版 社:化學(xué)工業(yè)出版社
- 中圖法分類:TP311.561
- 頁碼:310
- 紙張:
- 版次:01
- 開本:16開
Python是一種面向?qū)ο蟮哪_本語言,廣泛應(yīng)用于Web 開發(fā)、網(wǎng)絡(luò)編程、爬蟲開發(fā)、自動化運維、云計算、人工智能、科學(xué)計算等領(lǐng)域。本書是作者長期應(yīng)用Python進行機器學(xué)習(xí)開發(fā)實踐的經(jīng)驗結(jié)晶,主要內(nèi)容包括Python數(shù)據(jù)讀取的技巧,數(shù)據(jù)探索性分析,數(shù)據(jù)預(yù)處理,特征選擇,特征選擇的常用技巧,算法模型,sklearn類庫,Python中數(shù)據(jù)可視化的常用方法等。本書具有針對性、系統(tǒng)性、實操性強,原創(chuàng)度高的特點,讀者對代碼進行簡單修改,就可以直接拿來使用。
本書適合于具有一定Python基礎(chǔ),且有志于從事機器學(xué)習(xí)、人工智能開發(fā)的讀者使用。
1 數(shù)據(jù)讀取 1
1.1 數(shù)據(jù)讀取常見問題 2
1.2 核心代碼 4
1.2.1 讀取Excel、csv、txt、json數(shù)據(jù) 4
1.2.2 讀取docx文件和查詢關(guān)鍵詞 5
1.2.3 讀取日志、圖像、聲音、視頻 7
1.2.4 Oracle、MySQL數(shù)據(jù)讀取 13
1.2.5 讀取Hive數(shù)據(jù) 18
1.2.6 數(shù)據(jù)導(dǎo)出到本地 19
2 數(shù)據(jù)探索性分析 20
2.1 數(shù)據(jù)查看 21
2.2 數(shù)據(jù)統(tǒng)計 22
2.3 數(shù)據(jù)分組分析 23
2.4 相關(guān)性分析 24
2.5 典型案例 25
3 數(shù)據(jù)預(yù)處理 28
3.1 注意問題 30
3.2 核心代碼 31
3.2.1 缺失值檢測和處理 31
3.2.2 異常值檢測和處理 34
3.2.3 數(shù)據(jù)標準化規(guī)范化正則化 38
3.2.4 數(shù)據(jù)平滑處理 41
3.2.5 樣本類別分布不均衡處理 47
3.2.6 數(shù)據(jù)降維 51
3.2.7 訓(xùn)練集驗證集切分 56
3.3 典型案例 66
3.3.1 原理 66
3.3.2 代碼 68
4 特征選擇 69
4.1 過濾式特征提取 70
4.2 遞歸特征消除 73
4.3 嵌入式特征提取 74
4.4 典型案例 76
5 算法建模 79
5.1 主流數(shù)據(jù)挖掘算法 82
5.1.1 有監(jiān)督學(xué)習(xí) 82
5.1.2 無監(jiān)督學(xué)習(xí) 193
5.2 自動化調(diào)參 212
5.2.1 暴力搜索尋優(yōu) 213
5.2.2 隨機搜索尋優(yōu) 217
5.3 組合分類模型器 221
5.3.1 原理 221
5.3.2 函數(shù)及代碼 221
5.4 典型案例 226
5.4.1 人臉識別 227
5.4.2 多方程模型預(yù)測 232
6 可視化 237
6.1 基本圖形 239
6.1.1 折線圖 239
6.1.2 面積圖 248
6.1.3 柱形圖 253
6.1.4 散點圖 268
6.1.5 餅圖 279
6.2 分析圖形 280
6.2.1 詞云圖 280
6.2.2 相似度熱力圖 285
6.2.3 箱式分布圖 291
6.2.4 對應(yīng)分析圖 306