機器學習是計算機科學與人工智能的重要分支領域. 本書作為該領域的入門教材,在內(nèi)容上盡可能涵蓋機器學習基礎知識的各方面. 全書共16 章,大致分為3 個部分:第1 部分(第1~3 章)介紹機器學習的基礎知識;第2 部分(第4~10 章)討論一些經(jīng)典而常用的機器學習方法(決策樹、神經(jīng)網(wǎng)絡、支持向量機、貝葉斯分類器、集成學習、聚類、降維與度量學習);第3 部分(第11~16 章)為進階知識,內(nèi)容涉及特征選擇與稀疏學習、計算學習理論、半監(jiān)督學習、概率圖模型、規(guī)則學習以及強化學習等. 每章都附有習題并介紹了相關閱讀材料,以便有興趣的讀者進一步鉆研探索。
本書可作為高等院校計算機、自動化及相關專業(yè)的本科生或研究生教材,也可供對機器學習感興趣的研究人員和工程技術人員閱讀參考。
本書是針對非計算機專業(yè)編寫的機器學習教材,內(nèi)容由淺入深,使用目前流行的Python語言進行描述。書中示例豐富、落地,具有較高的學習價值。
1.內(nèi)容翔實,案例新穎
2.模擬實訓,代碼指導
3.資源豐富,便于教學
黃勉,上海財經(jīng)大學教授,研究方向為現(xiàn)代統(tǒng)計學方法、數(shù)據(jù)挖掘/機器學習、數(shù)量金融/量化投資,教授課程為數(shù)據(jù)挖掘、金融統(tǒng)計學、投資學。
第 1章 1
1.1 引言 1
1.2 基本術 2
1.3 假設空間 4
1.4 歸納偏好 6
1.5 發(fā)展歷程 10
1.6 應用現(xiàn)狀 13
1.7 閱讀材料 16
習題 19
參考文獻 20
休息一會兒 22
第 2章 模型評估與選擇 23
2.1 經(jīng)驗誤差與過擬合 23
2.2 評估方法 24
2.2.1 留出法 25
2.2.2 交叉驗證法 26
2.2.3 自助法 27
2.2.4 調(diào)參與最終模型 28
2.3 性能度量 28
2.3.1 錯誤率與精度 29
2.3.2 查準率、查全率與F1 30
2.3.3 ROC與AUC 33
2.3.4 代價敏感錯誤率與代價曲線 35
2.4 比較檢驗 37
2.4.1 假設檢驗 37
2.4.2 交叉驗證t檢驗 40
2.4.3 McNemar檢驗 41
2.4.4 Friedman檢驗與后續(xù)檢驗 42
2.5 偏差與方差 44
2.6 閱讀材料 46
習題 48
參考文獻 49
休息一會兒 51
第3章 線性模型 53
3.1 基本形式 53
3.2 線性回歸 53
3.3 對數(shù)幾率回歸 57
3.4 線性判別分析 60
3.5 多分類學習 63
3.6 類別不平衡問題 66
3.7 閱讀材料 67
習題 69
參考文獻 70
休息一會兒 72
第4章 決策樹 73
4.1 基本流程 73
4.2 劃分選擇 75
4.2.1 信息增益 75
4.2.2 增益率 77
4.2.3 基尼指數(shù) 79
4.3 剪枝處理 79
4.3.1 預剪枝 80
4.3.2 后剪枝 82
4.4 連續(xù)與缺失值 83
4.4.1 連續(xù)值處理 83
4.4.2 缺失值處理 85
4.5 多變量決策樹 88
4.6 閱讀材料 92