本書(shū)是美國(guó)著名數(shù)據(jù)挖掘算法專家、數(shù)值計(jì)算專業(yè)的數(shù)理統(tǒng)計(jì)學(xué)博士Timothy Masters的**作品。作為一名嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)挖掘工程師,應(yīng)用中的預(yù)測(cè)或分類使你經(jīng)常會(huì)面對(duì)成千上萬(wàn)的候選特征。這些特征絕大多數(shù)沒(méi)有價(jià)值或只有很小的價(jià)值,只有與某個(gè)或某些其他特征聯(lián)合起來(lái)才可能有用;一些特征可能有巨大的預(yù)測(cè)能力,但它們又可能僅存在于整體特征空間的某些區(qū)域……數(shù)據(jù)挖掘中,類似這種使人痛苦的問(wèn)題是無(wú)窮的。本書(shū)中的現(xiàn)代特征選擇技術(shù),將幫助你解決這些問(wèn)題。本書(shū)中所有的算法都可被直覺(jué)證實(shí),并有相關(guān)方程和解釋材料支撐。作者還展現(xiàn)了這些算法的完整的、受到高度好評(píng)的源代碼,并對(duì)其進(jìn)行了解析。本書(shū)適合算法、數(shù)據(jù)挖掘、人工智能等專業(yè)領(lǐng)域的教師、學(xué)生及相關(guān)的技術(shù)及研究人員作為參考及學(xué)習(xí)用書(shū)。
第1章 概述 1
第2章 前向選擇成分分析 3
前向選擇成分分析概述 3
數(shù)學(xué)原理與代碼示例 5
化解釋方差 6
方差化準(zhǔn)則代碼 7
后向細(xì)化 10
多線程后向細(xì)化 13
有序成分正交化 18
綜合應(yīng)用 20
僅前向選擇子集的成分變量 24
后向細(xì)化子集的成分變量 25
人工變量示例 26
第3章 局部特征選擇 30
算法概述 30
算法輸出結(jié)果 34
簡(jiǎn)要介紹:?jiǎn)渭冃嗡惴?34
線性規(guī)劃問(wèn)題 35
Simplex類的接口 36
更多細(xì)節(jié) 37
一種更嚴(yán)格的LFS方法 38
類內(nèi)分割和類間分割 41
計(jì)算權(quán)重 43
化類間分割 45
小化類內(nèi)分割 48
測(cè)試試驗(yàn)值 49
關(guān)于線程的簡(jiǎn)要說(shuō)明 52
CUDA權(quán)重計(jì)算 52
將CUDA代碼集成到算法中 53
初始化CUDA硬件 54
計(jì)算與當(dāng)前實(shí)例之差 56
計(jì)算距離矩陣 57
計(jì)算小距離 59
計(jì)算權(quán)重方程項(xiàng) 63
轉(zhuǎn)置項(xiàng)矩陣 64
權(quán)重項(xiàng)求和 65
權(quán)重遷移到主機(jī) 66
局部特征選擇示例 66
關(guān)于運(yùn)行時(shí)的解釋說(shuō)明 67
第4章 時(shí)間序列特征的記憶特性 68
簡(jiǎn)單數(shù)學(xué)概述 69
前向算法 70
后向算法 72
和修正 74
一些常規(guī)計(jì)算 78
均值和協(xié)方差 78
概率密度 79
多元正態(tài)概率密度函數(shù) 80
啟動(dòng)參數(shù) 81
初始化算法流程 81
對(duì)均值施加擾動(dòng) 82
對(duì)協(xié)方差施加擾動(dòng) 82
對(duì)轉(zhuǎn)移概率施加擾動(dòng) 83
關(guān)于隨機(jī)數(shù)發(fā)生器的解釋 83
完整優(yōu)化算法 84
計(jì)算狀態(tài)概率 85
更新均值和協(xié)方差 87
更新初始概率和轉(zhuǎn)移概率 89
HMM在時(shí)間序列中的記憶特性評(píng)估 93
鏈接特征變量與目標(biāo)變量 96
鏈接HMM狀態(tài)與目標(biāo) 102
一個(gè)人為的不當(dāng)示例 109
一個(gè)合理可行的示例 111
第5章 逐步選擇改進(jìn)算法 113
特征評(píng)估模型 114
基本模型實(shí)現(xiàn)代碼 115
交叉驗(yàn)證性能度量 118
逐步選擇算法 120
確定個(gè)變量 125
在現(xiàn)有模型中添加變量 127
三個(gè)算法演示示例 130
第6章 名義變量到有序變量的轉(zhuǎn)換 133
實(shí)現(xiàn)概述 135
合理關(guān)系測(cè)試 135
股票價(jià)格變動(dòng)示例 136
名義變量到有序變量變換實(shí)現(xiàn)代碼 138
構(gòu)造函數(shù) 139
輸出計(jì)數(shù)表 141
計(jì)算映射函數(shù) 143
Monte-Carlo置換檢驗(yàn) 145