本書分為基礎(chǔ)知識、社交網(wǎng)絡(luò)對齊方法、社交網(wǎng)絡(luò)對齊分析三部分,針對社交網(wǎng)絡(luò)對齊中的用戶對齊與社區(qū)對齊場景,系統(tǒng)地介紹了社交網(wǎng)絡(luò)對齊關(guān)鍵技術(shù)體系及其應(yīng)用。
在基礎(chǔ)知識部分,定義了社交網(wǎng)絡(luò)并進(jìn)行建模,介紹后續(xù)方法中所涉及的GNN、圖表示學(xué)習(xí)、知識圖譜表示等。在社交網(wǎng)絡(luò)方法部分,以模型建立、算法介紹、實(shí)驗(yàn)分析的邏輯,重點(diǎn)分析了五種社交網(wǎng)絡(luò)對齊方法:靜態(tài)的社交網(wǎng)絡(luò)用戶對齊方法、動(dòng)態(tài)的社交網(wǎng)絡(luò)用戶對齊方法、基于無監(jiān)督學(xué)習(xí)的社交網(wǎng)絡(luò)用戶對齊方法、基于遷移學(xué)習(xí)的社交網(wǎng)絡(luò)用戶對齊方法、基于雙曲空間的社交網(wǎng)絡(luò)社區(qū)對齊方法。在社交網(wǎng)絡(luò)對齊分析部分,對用戶推薦、社區(qū)發(fā)現(xiàn)、網(wǎng)絡(luò)騙局、趨勢分析等涉及實(shí)際社交網(wǎng)絡(luò)對齊技術(shù)的應(yīng)用進(jìn)行案例分析,總結(jié)并展望了社交網(wǎng)絡(luò)的未來發(fā)展趨勢及待解決問題。
1.作者所在學(xué)校具有深厚的計(jì)算機(jī)技術(shù)傳承,所在實(shí)驗(yàn)室為網(wǎng)絡(luò)與交換技術(shù)國家重點(diǎn)實(shí)驗(yàn)室。
2.目前市場社交網(wǎng)絡(luò)書籍空白很大,在社交網(wǎng)絡(luò)對齊方向還沒有相關(guān)的學(xué)術(shù)專著,對豐富社交網(wǎng)絡(luò)理論體系具有重要的意義。
3.理論與實(shí)際案例結(jié)合緊密,在系統(tǒng)詳細(xì)地介紹5種社交網(wǎng)絡(luò)對齊方法的模型、算法、實(shí)驗(yàn)的基礎(chǔ)上,結(jié)合常見的用戶推薦、虛假新聞監(jiān)測等應(yīng)用,分析如何在實(shí)際中運(yùn)用上述理論。
張忠寶,長期從事社交網(wǎng)絡(luò)分析、大數(shù)據(jù)處理領(lǐng)域研究工作。在該領(lǐng)域,創(chuàng)新性地提出了一系列針對靜態(tài)和動(dòng)態(tài)場景、用戶和社區(qū)粒度的社交網(wǎng)絡(luò)對齊方法,提出了一系列基于融合的跨社交網(wǎng)絡(luò)用戶畫像和分析方法,并研發(fā)了一個(gè)社交網(wǎng)絡(luò)對齊與分析平臺。該平臺在相關(guān)領(lǐng)域得到了重要應(yīng)用,實(shí)現(xiàn)了跨社交網(wǎng)絡(luò)賬號的關(guān)聯(lián)和融合分析,獲得了有關(guān)部門的肯定和認(rèn)可。申請人以第一或通信作者身份發(fā)表CCF A類論文8篇。作為課題負(fù)責(zé)人主持國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目課題1項(xiàng),主持國家自然科學(xué)基金項(xiàng)目2項(xiàng),包括聯(lián)合基金培育項(xiàng)目1項(xiàng)(大數(shù)據(jù)環(huán)境下的人物身份消歧與融合算法,U1936103)和青年基金項(xiàng)目1項(xiàng)(動(dòng)態(tài)環(huán)境下的虛擬網(wǎng)絡(luò)映射方法研究,61602050),以主研人參與國家重點(diǎn)研發(fā)計(jì)劃課題、國家自然科學(xué)基金創(chuàng)新研究群體項(xiàng)目和國家自然科學(xué)基金重點(diǎn)項(xiàng)目各1項(xiàng)。 申請人取得的主要研究成果有:1)在靜態(tài)社交網(wǎng)絡(luò)對齊方面,提出了一種魯棒的、可充分利用多社交網(wǎng)絡(luò)信息的用戶對齊方法,實(shí)現(xiàn)了多個(gè)社交網(wǎng)絡(luò)間高效率、高準(zhǔn)確率的用戶對齊(IJCAI 2018、TKDE 2021);2)在動(dòng)態(tài)用戶對齊方面,提出了一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)的社交網(wǎng)絡(luò)用戶對齊方法和一種基于用戶行為分析的社交網(wǎng)絡(luò)用戶對齊方法,提高了對齊的準(zhǔn)確率(IJCAI 2020、AAAI 2021、AAAI 2022);3)在知識圖譜表示方面,提出了一種基于狄利克雷分布的知識圖譜表示方法,提升了表示的準(zhǔn)確性(WWW 2022)。 在社會(huì)服務(wù)方面,擔(dān)任中國計(jì)算機(jī)學(xué)會(huì)服務(wù)計(jì)算專委會(huì)秘書處成員,中國人工智能學(xué)會(huì)委員,中國計(jì)算機(jī)學(xué)會(huì)大數(shù)據(jù)專委會(huì)通訊委員。擔(dān)任IEEE TKDE、AAAI、IEEE TNSM、Information Science、Computer Network、Globecom、ICC等20余個(gè)知名國際期刊審稿人/PC member。
第 一章 社交網(wǎng)絡(luò) 11
1.1 社交網(wǎng)絡(luò)與圖 11
1.1.1 社交網(wǎng)絡(luò) 12
1.1.2 社交網(wǎng)絡(luò)的形式化表達(dá) 18
1.2 圖 24
1.2.1 圖的經(jīng)典算法 24
1.2.2 圖的結(jié)構(gòu)分析 29
1.2.3 特殊的圖 34
1.3 社交網(wǎng)絡(luò)建模 37
1.3.1 小世界理論和六度空間 38
1.3.2 ER隨機(jī)網(wǎng)絡(luò)模型 38
1.3.3 WS小世界網(wǎng)絡(luò)模型 40
1.3.4 Barabási無標(biāo)度網(wǎng)絡(luò)模型 42
1.4 本章小結(jié) 44
參考文獻(xiàn) 44
第二章 圖神經(jīng)網(wǎng)絡(luò) 46
2.1 圖神經(jīng)網(wǎng)絡(luò)基礎(chǔ) 46
2.1.1 神經(jīng)元 46
2.1.2 多層感知機(jī) 49
2.1.3 誤差反向傳播算法 52
2.1.4 圖神經(jīng)網(wǎng)絡(luò) 55
2.2 圖卷積網(wǎng)絡(luò) 55
2.2.1 卷積與池化 55
2.2.2 圖卷積 57
2.2.3 頻域圖卷積 58
2.2.4 空域圖卷積 65
2.3 圖注意力網(wǎng)絡(luò) 67
2.3.1 注意力機(jī)制 67
2.3.2 圖注意力網(wǎng)絡(luò) 69
2.4 本章小結(jié) 70
參考文獻(xiàn) 71
第三章 圖表示學(xué)習(xí)及其應(yīng)用 73
3.1 圖嵌入相關(guān)理論 73
3.1.1 圖嵌入 73
3.1.2 編碼器與解碼器 74
3.2 基于隨機(jī)游走的圖表示學(xué)習(xí) 76
3.2.1DeepWalk 77
3.2.2 Node2vec 80
3.2.3 Metapath2vec 82
3.3 基于深度學(xué)習(xí)的圖表示學(xué)習(xí) 85
3.3.1 GraphSAGE 85
3.3.2 VGAE 88
3.3.3 GraphCL 91
3.4 本章小節(jié) 94
參考文獻(xiàn) 94
第四章 基于微分方程的動(dòng)態(tài)圖表示學(xué)習(xí)方法 96
4.1 問題定義 100
4.1.1 符號與概念 100
4.1.2 問題描述 102
4.2 基于微分方程的動(dòng)態(tài)圖網(wǎng)絡(luò)表示學(xué)習(xí)算法 102
4.2.1 算法框架 102
4.2.2 初始化 103
4.2.3 節(jié)點(diǎn)鄰居采樣 105
4.2.4 聚合操作 106
4.2.5 自定義損失函數(shù)與端到端優(yōu)化 110
4.2.6 性能分析 111
4.3 基于受控微分方程的改進(jìn)算法 112
4.3.1 問題引入 112
4.3.2 解決方案與分析 113
4.3.3 小結(jié) 117
4.4 實(shí)驗(yàn)與分析 118
4.4.1 數(shù)據(jù)集 118
4.4.2 評價(jià)指標(biāo) 119
4.4.3 對比方法 120
4.4.4 參數(shù)設(shè)置 121
4.4.5 主要結(jié)果和分析 123
4.4.6 其他結(jié)果 127
4.5 本章小結(jié) 128
參考文獻(xiàn) 130
第五章 基于狄利克雷分布的知識圖譜表示方法 134
5.1 問題定義 136
5.1.1 符號與概念 136
5.1.2 問題描述 137
5.2 利用狄利克雷分布的知識表示學(xué)習(xí) 137
5.2.1 模型建立 137
5.2.2 優(yōu)化目標(biāo) 139
5.3 DiriE表現(xiàn)能力理論分析 140
5.3.1 實(shí)體與關(guān)系的二元嵌入 140
5.3.2 復(fù)雜關(guān)系的表現(xiàn)能力 141
5.3.3 知識圖譜的不確定性 143
5.4 實(shí)驗(yàn)與分析 144
5.4.1 數(shù)據(jù)集 144
5.4.2 相關(guān)任務(wù) 144
5.4.3 評價(jià)指標(biāo) 145
5.4.4 主要結(jié)果和分析 145
5.4.5 關(guān)系模式與不確定性分析 147
5.5 本章小結(jié) 151
參考文獻(xiàn) 152
第六章 靜態(tài)的社交網(wǎng)絡(luò)用戶對齊方法 156
6.1 問題定義 157
6.1.1 符號與概念 157
6.1.2 問題描述 158
6.2 基于矩陣分解的用戶對齊方法 159
6.2.1 方法概述 159
6.2.2 有約束的雙重表征模型 160
6.2.3 非凸解耦的交替優(yōu)化算法 162
6.2.4 收斂性分析 166
6.3 基于模糊聚類的并行化對齊方法 172
6.3.1 方法概述 173
6.3.2 增廣圖輔助表征階段 174
6.3.3 平衡感知的模糊聚類階段 174
6.4 實(shí)驗(yàn)與分析 176
6.4.1 數(shù)據(jù)集 176
6.4.2 評價(jià)指標(biāo) 177
6.4.3 對比方法 177
6.4.4 參數(shù)設(shè)置 178
6.4.5 結(jié)果和分析 178
6.5 本章小結(jié) 185
參考文獻(xiàn) 186
第七章 動(dòng)態(tài)的社交網(wǎng)絡(luò)用戶對齊方法 189
7.1 問題定義 190
7.1.1 符號與概念 191
7.1.2 問題描述 191
7.2 基于圖神經(jīng)網(wǎng)絡(luò)的聯(lián)合優(yōu)化模型 191
7.2.1 模型概述 192
7.2.2 動(dòng)態(tài)圖自編碼機(jī) 193
7.2.3 本征表示學(xué)習(xí) 195
7.2.4 聯(lián)合優(yōu)化模型 196
7.3 協(xié)同圖深度學(xué)習(xí)的交替優(yōu)化算法 196
7.3.1 算法概述 197
7.3.2 投影矩陣最優(yōu)化子問題 198
7.3.3 本征矩陣最優(yōu)化子問題 199
7.3.4 收斂性分析 201
7.4 實(shí)驗(yàn)與分析 206
7.4.1 數(shù)據(jù)集 206
7.4.2 評價(jià)指標(biāo) 207
7.4.3 對比方法 207
7.4.4 參數(shù)設(shè)置 208
7.4.5 結(jié)果和分析 209
7.5 本章小結(jié) 218
參考文獻(xiàn) 219
第八章 基于無監(jiān)督學(xué)習(xí)的社交網(wǎng)絡(luò)用戶對齊方法 222
8.1 問題定義 224
8.1.1 符號與概念 224
8.1.2 問題描述 226
8.2 基于結(jié)構(gòu)的無監(jiān)督多網(wǎng)絡(luò)用戶對齊框架 227
8.2.1 結(jié)構(gòu)公共子空間 227
8.2.2 多網(wǎng)絡(luò)節(jié)點(diǎn)映射 231
8.2.3 用戶相似度計(jì)算 233
8.3 聯(lián)合優(yōu)化算法 234
8.3.1 公共子空間基 H 234
8.3.2 對角錐矩陣 B 239
8.3.3 復(fù)雜度分析 242
8.4 實(shí)驗(yàn)與分析 243
8.4.1 數(shù)據(jù)集 243
8.4.2 評價(jià)指標(biāo) 246
8.4.3 對比方法 247
8.4.4 參數(shù)設(shè)置 248
8.4.5 主要結(jié)果和分析 249
8.5 本章小結(jié) 253
參考文獻(xiàn) 254
第九章 基于遷移學(xué)習(xí)的社交網(wǎng)絡(luò)用戶對齊方法 257
9.1 問題定義 260
9.1.1 符號與概念 260
9.1.2 問題描述 262
9.2 REBORN框架 262
9.2.1 Ego-Transformer:社交網(wǎng)絡(luò)對齊 262
9.2.2 WWGAN:領(lǐng)域差異消除 267
9.2.3 REBORN:統(tǒng)一框架 270
9.3 實(shí)驗(yàn)與分析 272
9.3.1 數(shù)據(jù)集 273
9.3.2 評價(jià)指標(biāo) 273
9.3.3 對比方法 274
9.3.4 參數(shù)設(shè)置 275
9.3.5 主要結(jié)果和分析 277
9.4 本章小結(jié) 283
參考文獻(xiàn) 284
第十章 基于雙曲空間的社交網(wǎng)絡(luò)社區(qū)對齊方法 289
10.1 問題定義 290
10.1.1 符號與概念 290
10.1.2 問題描述 291
10.2 基于雙曲空間的社區(qū)對齊模型 291
10.2.1 模型概述 292
10.2.2 表征空間選擇 292
10.2.3 雙曲空間與龐加萊球模型 295
10.2.4 社交網(wǎng)絡(luò)的雙曲空間嵌入 297
10.2.5 混合雙曲聚類模型 297
10.2.6 社區(qū)對齊的最優(yōu)化問題 298
10.3 基于黎曼幾何的交替優(yōu)化算法 299
10.3.1 算法概述 300
10.3.2 社區(qū)表征最優(yōu)化子問題 302
10.3.3 公共子空間最優(yōu)化子問題 304
10.3.4 可識別性分析 306
10.4 實(shí)驗(yàn)與分析 308
10.4.1 數(shù)據(jù)集 308
10.4.2 評價(jià)指標(biāo) 309
10.4.3 對比方法 309
10.4.4 參數(shù)設(shè)置 311
10.4.5 結(jié)果和分析 311
10.5 本章小結(jié) 316
參考文獻(xiàn) 317
第十一章 社交網(wǎng)絡(luò)中的用戶推薦 320
11.1 簡介 320
11.1.1用戶推薦對社交網(wǎng)絡(luò)的作用和意義 320
11.1.2用戶推薦系統(tǒng)架構(gòu) 321
11.2 基于傳統(tǒng)的推薦 (經(jīng)典方法) 324
11.2.1 協(xié)同過濾User-CF Item-CF 324
11.2.2 邏輯回歸 328
11.2.3 FM(Factorization Machine,因子分解機(jī)) 329
11.2.4 GBDT LR 331
11.3 基于深度學(xué)習(xí)的推薦 (早期純深度學(xué)習(xí)經(jīng)典方法) 333
11.3.1 Deep Crossing (2016) 333
11.3.2 Neural CF 335
11.3.3 PNN模型 336
11.3.4 DIN 或 AFM (注意力機(jī)制引入) 337
11.4 推薦在社交網(wǎng)絡(luò)的具體應(yīng)用 339
11.4.1 注意力機(jī)制的實(shí)踐 339
11.4.2 自動(dòng)學(xué)習(xí)路徑遞歸 342
11.4.3跨域推薦實(shí)現(xiàn) 343
11.5 推薦的熱點(diǎn)方向 345
11.5.1 DIEN 345
11.5.2自注意時(shí)序推薦 346
11.5.3 BERT4Rec順序推薦模型 348
11.6 本章小結(jié) 349
參考文獻(xiàn) 349
第十二章 社區(qū)發(fā)現(xiàn) 352
12.1社區(qū)發(fā)現(xiàn)簡介 352
12.1.1 社區(qū)發(fā)現(xiàn)的背景 353
12.1.2 社區(qū)發(fā)現(xiàn)的定義與預(yù)備知識 354
12.1.3 社區(qū)發(fā)現(xiàn)的發(fā)展歷史 355
12.2基于卷積網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法 358
12.2.1基于CNN的社區(qū)發(fā)現(xiàn) 358
12.2.2基于GCN的社區(qū)發(fā)現(xiàn) 367
12.3基于圖注意力網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法 375
12.3.1 MAGNN: 用于異質(zhì)圖嵌入的元路徑聚合圖神經(jīng)網(wǎng)絡(luò) 375
12.3.2 DMGI:無監(jiān)督的多重網(wǎng)絡(luò)屬性表示 379
12.3.3HDMI: 高階深度可復(fù)用信息網(wǎng)絡(luò) 382
12.4基于圖對抗網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)方法 384
12.4.1 JANE:聯(lián)合對抗網(wǎng)絡(luò)表示 384
12.4.2 ProGAN: 通過近似生成對抗網(wǎng)絡(luò)進(jìn)行網(wǎng)絡(luò)嵌入 387
12.4.3 CANE:基于對抗訓(xùn)練的社區(qū)發(fā)現(xiàn)網(wǎng)絡(luò)表示 390
12.5基于自編碼器的社區(qū)發(fā)現(xiàn)方法 391
12.5.1 SDCN:結(jié)構(gòu)式深度聚類網(wǎng)絡(luò) 391
12.5.2 MAGCN:多視點(diǎn)屬性圖卷積網(wǎng)絡(luò)聚類模型 397
12.5.3 One2Multi:基于多視圖圖聚類的圖自編碼器 400
12.6 本章小結(jié)403
參考文獻(xiàn) 403
第十三章 社交網(wǎng)絡(luò)騙局 406
13.1 簡介 406
13.2 欺詐用戶檢測 407
13.2.1概述 407
13.2.2 圖在欺詐用戶檢測中的應(yīng)用 408
13.2.3 基于圖卷積神經(jīng)網(wǎng)絡(luò)的垃圾郵件檢測 411
13.2.4 基于強(qiáng)化學(xué)習(xí)檢測偽裝欺詐者 415
13.3謠言檢測 417
13.3.1 概述 417
13.3.2 基于雙向圖卷積網(wǎng)絡(luò)(Bi-GCN)的謠言檢測 419
13.3.3基于事件增強(qiáng)的謠言檢測 422
13.3.4 基于圖結(jié)構(gòu)對抗學(xué)習(xí)的社交網(wǎng)絡(luò)謠言檢測 424
13.3.5 基于聯(lián)合學(xué)習(xí)的突發(fā)謠言檢測 428
13.4 虛假新聞檢測 431
13.4.1 概述 431
13.4.2 基于用戶可信度社交網(wǎng)絡(luò)虛假新聞檢測 432
13.4.3 基于強(qiáng)化學(xué)習(xí)的弱監(jiān)督虛假新聞檢測 435
13.4.4 基于遷移學(xué)習(xí)的虛假新聞檢測 439
13.5本章小節(jié) 441
參考文獻(xiàn) 442
第十四章 社交網(wǎng)絡(luò)趨勢分析 445
14.1 簡介 445
14.2 情感分析 446
14.2.1 概述 446
14.2.2 用于社交網(wǎng)絡(luò)情感分析的卷積LSTM模型 447
14.2.3 基于模糊規(guī)則的社交網(wǎng)絡(luò)無監(jiān)督情感分析 450
14.2.4 面向多模態(tài)社交網(wǎng)絡(luò)的輿情情感分析 452
14.3 觀點(diǎn)挖掘 453
14.3.1 概述 453
14.3.2基于詞匯和機(jī)器學(xué)習(xí)的社交網(wǎng)絡(luò)有用意見挖掘方法 454
14.3.3 基于多模態(tài)多視圖的觀點(diǎn)挖掘 456
14.3.4 基于交互式更新標(biāo)簽的新冠疫情觀點(diǎn)挖掘 459
14.4 熱點(diǎn)事件分析 461
14.4.1 概述 461
14.4.2 社交網(wǎng)絡(luò)中實(shí)時(shí)緊急熱點(diǎn)識別系統(tǒng) 462
14.4.3 基于知識的多模態(tài)社會(huì)熱點(diǎn)分析 463
14.4.4 社交熱點(diǎn)的推特情感分析 466
14.5 用戶影響力分析 469
14.5.1概述 469
14.5.2衡量社交網(wǎng)絡(luò)用戶影響力的傳統(tǒng)方法 470
14.5.3 基于PageRank的微博用戶影響力分析 473
14.5.4 Github開發(fā)者社交網(wǎng)絡(luò)用戶影響分析 476
14.6本章小節(jié) 480
參考文獻(xiàn) 481