大數(shù)據(jù)處理方法與電信客戶價(jià)值管理
定 價(jià):69 元
- 作者:鄧維斌, 胡峰, 劉進(jìn)著
- 出版時(shí)間:2020/8/1
- ISBN:9787121394560
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:F626
- 頁碼:200
- 紙張:膠版紙
- 版次:1
- 開本:16K
近年來,大數(shù)據(jù)已在公共管理、醫(yī)療衛(wèi)生、金融與商務(wù)等領(lǐng)域得到了廣泛應(yīng)用。如何對(duì)海量和高速增長的數(shù)據(jù)進(jìn)行有效處理以及如何針對(duì)不同領(lǐng)域特點(diǎn)有效應(yīng)用大數(shù)據(jù),倍受廣大科研工作者的廣泛關(guān)注。本書集結(jié)了作者近年來在大數(shù)據(jù)及其應(yīng)用領(lǐng)域的研究成果,針對(duì)大數(shù)據(jù)高效處理問題,從點(diǎn)排序識(shí)別聚類、多標(biāo)簽排序、不平衡數(shù)據(jù)采樣、主動(dòng)學(xué)習(xí)、增量學(xué)習(xí)等方面研究并設(shè)計(jì)了相關(guān)算法。在此基礎(chǔ)上,對(duì)大數(shù)據(jù)環(huán)境下電信客戶價(jià)值評(píng)價(jià)、客戶換機(jī)預(yù)測(cè)和客戶流失預(yù)測(cè)等問題,設(shè)計(jì)了相關(guān)算法、流程和仿真實(shí)驗(yàn),并提出了一些合理化的建議,為大數(shù)據(jù)分析與在相關(guān)行業(yè)的應(yīng)用提供了參考。
章 大數(shù)據(jù)處理概述 1
1.1 大數(shù)據(jù)的定義 1
1.2 大數(shù)據(jù)帶來的挑戰(zhàn)與機(jī)遇 3
1.3 大數(shù)據(jù)研究的現(xiàn)狀 5
1.3.1 大數(shù)據(jù)處理平臺(tái) 5
1.3.2 大數(shù)據(jù)處理算法 6
1.3.3 大數(shù)據(jù)應(yīng)用研究 9
1.4 大數(shù)據(jù)研究的挑戰(zhàn)與趨勢(shì) 10
1.5 本章小結(jié) 11
參考文獻(xiàn) 12
第2章 Spark點(diǎn)排序識(shí)別聚類結(jié)構(gòu)算法 19
2.1 引言 19
2.2 點(diǎn)排序識(shí)別聚類結(jié)構(gòu)算法 21
2.3 Spark并行內(nèi)存計(jì)算框架 23
2.4 基于Spark的OPTICS算法 25
2.5 仿真實(shí)驗(yàn)與結(jié)果分析 27
2.5.1 度量標(biāo)準(zhǔn) 27
2.5.2 數(shù)據(jù)集與運(yùn)行環(huán)境 28
2.5.3 實(shí)驗(yàn)方法 29
2.5.4 實(shí)驗(yàn)結(jié)果與分析 29
2.6 本章小結(jié) 32
參考文獻(xiàn) 33
第3章 Spark標(biāo)簽校準(zhǔn)排序多標(biāo)簽算法 35
3.1 引言 35
3.2 校準(zhǔn)標(biāo)簽排序算法與并行化研究 36
3.2.1 校準(zhǔn)標(biāo)簽排序算法介紹 36
3.2.2 校準(zhǔn)標(biāo)簽排序算法研究現(xiàn)狀 37
3.3 樸素貝葉斯校準(zhǔn)標(biāo)簽排序方法 37
3.3.1 樸素貝葉斯概率模型 37
3.3.2 樸素貝葉斯校準(zhǔn)標(biāo)簽排序算法 38
3.3.3 仿真實(shí)驗(yàn)與結(jié)果分析 40
3.4 樸素貝葉斯校準(zhǔn)標(biāo)簽排序方法的并行化研究 44
3.4.1 Spark并行化內(nèi)存計(jì)算 44
3.4.2 樸素貝葉斯校準(zhǔn)標(biāo)簽排序算法的并行化研究 45
3.4.3 仿真實(shí)驗(yàn)與結(jié)果分析 47
3.5 本章小結(jié) 51
參考文獻(xiàn) 52
第4章 不平衡數(shù)據(jù)的樣本權(quán)重欠采樣方法 54
4.1 引言 54
4.2 不平衡數(shù)據(jù)處理的相關(guān)方法 55
4.2.1 K-means聚類算法 55
4.2.2 AdaCost算法 56
4.2.3 Bagging算法 58
4.3 基于樣本權(quán)重的欠采樣方法 59
4.3.1 樣本權(quán)重的確定 59
4.3.2 分類器加權(quán)投票 60
4.4 仿真實(shí)驗(yàn)與結(jié)果分析 61
4.4.1 分類的評(píng)價(jià)方法 61
4.4.2 非參數(shù)統(tǒng)計(jì)檢驗(yàn)方法 62
4.4.3 UCI數(shù)據(jù)集檢驗(yàn) 63
4.5 本章小結(jié) 67
參考文獻(xiàn) 68
第5章 不平衡數(shù)據(jù)的三支決策過采樣算法 70
5.1 引言 70
5.2 三支決策粗糙集 71
5.2.1 鄰域模型 71
5.2.2 鄰域三支決策模型 71
5.3 不平衡數(shù)據(jù)的三支決策過采樣算法 74
5.3.1 算法思路 74
5.3.2 算法描述與分析 76
5.4 仿真實(shí)驗(yàn)與結(jié)果分析 77
5.4.1 數(shù)據(jù)集選擇 77
5.4.2 實(shí)驗(yàn)方法 78
5.4.3 實(shí)驗(yàn)結(jié)果分析 79
5.5 本章小結(jié) 84
參考文獻(xiàn) 84
第6章 三支決策主動(dòng)學(xué)習(xí)方法 87
6.1 引言 87
6.2 主動(dòng)學(xué)習(xí)理論 88
6.2.1 主動(dòng)學(xué)習(xí)工作機(jī)制 88
6.2.2 主動(dòng)學(xué)習(xí)方法的分類 88
6.3 三支決策主動(dòng)學(xué)習(xí) 89
6.3.1 對(duì)冗余信息的刪減 89
6.3.2 對(duì)無標(biāo)簽樣本的區(qū)域劃分 90
6.3.3 對(duì)不同區(qū)域樣本的處理 91
6.3.4 算法描述 92
6.4 仿真實(shí)驗(yàn)與結(jié)果分析 95
6.4.1 數(shù)據(jù)集選擇 95
6.4.2 實(shí)驗(yàn)方法 95
6.4.3 實(shí)驗(yàn)結(jié)果分析 96
6.5 本章小結(jié) 100
參考文獻(xiàn) 100
第7章 鄰域粗糙集主動(dòng)學(xué)習(xí)方法 104
7.1 引言 104
7.2 鄰域粗糙集基本理論 104
7.3 鄰域粗糙集主動(dòng)學(xué)習(xí)算法 106
7.3.1 算法思路 106
7.3.2 算法描述 109
7.4 仿真實(shí)驗(yàn)與結(jié)果分析 110
7.4.1 數(shù)據(jù)集與實(shí)驗(yàn)方法 110
7.4.2 結(jié)果與分析 111
7.5 本章小結(jié) 117
參考文獻(xiàn) 118
第8章 決策熵增量學(xué)習(xí)方法 120
8.1 引言 120
8.2 粗糙集的基本概念 121
8.3 決策熵增量知識(shí)獲取算法 123
8.3.1 算法復(fù)雜度分析 126
8.3.2 實(shí)例分析 126
8.4 仿真實(shí)驗(yàn)與結(jié)果分析 128
8.4.1 UCI數(shù)據(jù)集測(cè)試 128
8.4.2 KDDCUP99數(shù)據(jù)集測(cè)試 130
8.4.3 KDDCUP99數(shù)據(jù)集連續(xù)增量測(cè)試 130
8.5 本章小結(jié) 131
參考文獻(xiàn) 131
第9章 MapReduce并行增量FP-Growth算法 133
9.1 引言 133
9.2 MapReduce編程模型與Hadoop平臺(tái) 135
9.2.1 MapReduce編程模型 135
9.2.1 Hadoop平臺(tái)介紹 136
9.3 MapReduce增量FP-Growth算法 138
9.3.1 增量學(xué)習(xí) 138
9.3.2 FP-Growth算法 139
9.3.3 MapReduce并行FP-Growth算法 140
9.3.4 MapReduce并行增量FP-Growth算法 141
9.4 仿真實(shí)驗(yàn)與結(jié)果分析 143
9.4.1 MapReduce并行增量FP-Growth算法單機(jī)效率測(cè)試 143
9.4.2 MapReduce并行增量FP-Growth算法集群效率測(cè)試 143
9.4.3 Mapreduce并行增量FP-Growth算法性能測(cè)試 146
9.5 本章小結(jié) 149
參考文獻(xiàn) 149
0章 電信客戶價(jià)值評(píng)價(jià) 151
10.1 引言 151
10.2 客戶價(jià)值與評(píng)價(jià) 152
10.2.1 客戶價(jià)值的概念 152
10.2.2 電信客戶價(jià)值與評(píng)價(jià) 153
10.3 優(yōu)勢(shì)關(guān)系粗糙集的基本概念 155
10.4 領(lǐng)域及數(shù)據(jù)驅(qū)動(dòng)的數(shù)據(jù)挖掘模型 156
10.4.1 數(shù)據(jù)驅(qū)動(dòng)的數(shù)據(jù)挖掘 156
10.4.2 領(lǐng)域驅(qū)動(dòng)的數(shù)據(jù)挖掘 157
10.4.3 面向領(lǐng)域的數(shù)據(jù)驅(qū)動(dòng)的數(shù)據(jù)挖掘 158
10.5 領(lǐng)域及數(shù)據(jù)驅(qū)動(dòng)的電信客戶價(jià)值評(píng)價(jià)方法 159
10.5.1 電信客戶價(jià)值評(píng)價(jià)的特征提取 159
10.5.2 電信客戶價(jià)值評(píng)價(jià)流程 161
10.5.3 電信客戶價(jià)值評(píng)價(jià)算法 162
10.6 仿真實(shí)驗(yàn) 163
10.6.1 算法效果驗(yàn)證 163
10.6.2 算法應(yīng)用 165
10.7 本章小結(jié) 167
參考文獻(xiàn) 167
1章 電信客戶換機(jī)預(yù)測(cè) 171
11.1 引言 171
11.2 優(yōu)勢(shì)關(guān)系粗糙集換機(jī)預(yù)測(cè)方法 172
11.2.1 算法描述 172
11.2.2 仿真實(shí)驗(yàn) 174
11.3 數(shù)據(jù)驅(qū)動(dòng)的電信客戶換機(jī)預(yù)測(cè)方法 179
11.3.1 手機(jī)客戶特征提取 179
11.3.2 算法描述 180
11.3.3 仿真實(shí)驗(yàn) 182
11.4 本章小結(jié) 185
參考文獻(xiàn) 186
2章 電信客戶流失預(yù)測(cè) 188
12.1 引言 188
12.2 C4.5決策樹及其改進(jìn)算法 189
12.2.1 C4.5決策樹 189
12.2.2 改進(jìn)C4.5決策樹算法 190
12.3 改進(jìn)C4.5決策樹不平衡數(shù)據(jù)抽樣方法 191
12.3.1 算法思路 191
12.3.2 算法描述 192
12.4 實(shí)驗(yàn)與結(jié)果分析 193
12.4.1 電信客戶流失預(yù)測(cè)流程 194
12.4.2 實(shí)驗(yàn)數(shù)據(jù)選擇 195
12.2.3 實(shí)驗(yàn)結(jié)果與分析 196
12.5 本章小結(jié) 198
參考文獻(xiàn) 198