《術(shù)語相似度計(jì)算方法研究》對術(shù)語相似度計(jì)算方法的 研究,為多種知識發(fā)現(xiàn)和自然語言處理任務(wù)的開展創(chuàng)造了條件。盡管術(shù)語 相似度計(jì)算相關(guān)研究已經(jīng)或正在探索基于各種特征或知識資源開展術(shù)語相 似關(guān)系挖掘任務(wù)的思路和技術(shù)方法,但是在相似度指標(biāo)的計(jì)算以及高效集 成多種術(shù)語相似度指標(biāo)方面仍存在較多問題。本書在全面介紹當(dāng)前各種典 型術(shù)語相似度計(jì)算思路的基礎(chǔ)上,針對應(yīng)用中實(shí)際存在的問題,提出或改 進(jìn)了基于語詞、基于語境以及基于網(wǎng)絡(luò)資源的術(shù)語相似度指標(biāo)計(jì)算方法,設(shè)計(jì)和實(shí)現(xiàn)了多種相似度指標(biāo)高效集成計(jì)算模型,有效地提高了術(shù)語相似 度計(jì)算的綜合性能。《術(shù)語相似度計(jì)算方法研究》可作為自然語言處理、知識發(fā)現(xiàn)等相關(guān) 方向的教學(xué)、科研人員研究的參考資料。
《術(shù)語相似度計(jì)算方法研究》在全面介紹當(dāng)前各種典型術(shù)語相似度計(jì)算思路的基礎(chǔ)上,針對應(yīng)用中實(shí)際存在的問題,提出或改進(jìn)了基于語詞、基于語境以及基于網(wǎng)絡(luò)資源的術(shù)語相似度指標(biāo)計(jì)算方法,設(shè)計(jì)和實(shí)現(xiàn)了多種相似度指標(biāo)高效集成計(jì)算模型,有效地提高了術(shù)語相似度計(jì)算的綜合性能,可作為自然語言處理、知識發(fā)現(xiàn)等相關(guān)方向的教學(xué)、科研人員研究的參考資料。
徐健(1977一),男,中山大學(xué)資訊管理學(xué)院講師,情報學(xué)博士。2000年在西安交通大學(xué)獲學(xué)士學(xué)位,2003年在中山大學(xué)獲碩士學(xué)位,2010年在中國科學(xué)院獲情報學(xué)博士學(xué)位。2003年7月在中山大學(xué)碩士畢業(yè)后留校任教至今。主要研究方向?yàn)椋孩僦悄苄畔⑻幚;②網(wǎng)絡(luò)信息挖掘;③術(shù)語相似度計(jì)算及應(yīng)用技術(shù)。已發(fā)表研究論文30篇。目前主持1項(xiàng)教育部人文社會科學(xué)研究項(xiàng)目“從科技文獻(xiàn)中挖掘術(shù)語相似性及其在知識發(fā)現(xiàn)中的應(yīng)用”,1項(xiàng)國家社會科學(xué)基金項(xiàng)目“用戶評論情感分析及其在競爭情報服務(wù)中的應(yīng)用研究”,并參與多項(xiàng)國家、省部級科研項(xiàng)目工作。
第1章 緒論
1.1 術(shù)語相似度計(jì)算研究緣起
1.2 研究的目的及意義
1.2.1 研究目的
1.2.2 研究意義
1.3 相關(guān)概念界定
1.3.1 術(shù)語
1.3.2 術(shù)語語義相似度
1.4 研究思路與方法
1.4.1 研究思路
1.4.2 研究方法
1.5 本書內(nèi)容組織結(jié)構(gòu)
第2章 術(shù)語相似度計(jì)算研究概述
2.1 術(shù)語相似度計(jì)算相關(guān)研究
2.1.1 術(shù)語相似性測度研究
2.1.2 基于語詞構(gòu)成特征的術(shù)語相似度算法研究
2.1.3 基于句法特征的術(shù)語相似度算法研究
2.1.4 基于語境特征的術(shù)語相似度算法研究
2.1.5 基于語詞知識體系的術(shù)語相似度算法研究
2.1.6 基于網(wǎng)絡(luò)知識資源的術(shù)語相似度算法研究
2.1.7 術(shù)語相似度指標(biāo)集成算法研究
2.1.8 術(shù)語語義相似度計(jì)算應(yīng)用研究
2.2 術(shù)語相似度計(jì)算技術(shù)路線評述
2.2.1 典型算法計(jì)算思路的特點(diǎn)
2.2.2 典型算法計(jì)算思路的不足
2.3 術(shù)語相似度計(jì)算改進(jìn)思路
2.3.1 計(jì)算方法的改進(jìn)
2.3.2 集成模型的改進(jìn)
2.4 小結(jié)
第3章 術(shù)語主詞軟匹配相似度算法研究
3.1 SSHW算法的提出
3.2 SSHW算法思想及算法設(shè)計(jì)
3.2.1 SSHW算法思想
3.2.2 SSHW算法設(shè)計(jì)
3.3 SSHW算法實(shí)現(xiàn)
3.4 SSHW算法評測
3.4.1 實(shí)驗(yàn)?zāi)康?br>3.4.2 實(shí)驗(yàn)數(shù)據(jù)
3.4.3 實(shí)驗(yàn)過程
3.4.4 數(shù)據(jù)分析
3.4.5 實(shí)驗(yàn)結(jié)論
3.5 小結(jié)
第4章 Hea t句法模板相似度改進(jìn)算法研究
4.1 Hea t句法模板相似度算法改進(jìn)思路
4.2 算法設(shè)計(jì)
4.2.1 算法設(shè)計(jì)思路
4.2.2 算法表達(dá)
4.3 算法實(shí)現(xiàn)
4.3.1 句法模板構(gòu)建
4.3.2 計(jì)算過程
4.4 算法評測
4.4.1 實(shí)驗(yàn)?zāi)康?br>4.4.2 實(shí)驗(yàn)數(shù)據(jù)
4.4.3 實(shí)驗(yàn)過程
4.4.4 數(shù)據(jù)分析
4.4.5 實(shí)驗(yàn)結(jié)論
4.5 小結(jié)
第5章 語境依賴關(guān)系模式相似度算法研究
5.1 DRCP算法的提出
5.2 DRCP算法思想及算法設(shè)計(jì)
5.2.1 DRCP算法思想
5.2.2 DRCP算法設(shè)計(jì)
5.3 DRCP算法實(shí)現(xiàn)
5.4 DRCP算法評測
5.4.1 實(shí)驗(yàn)?zāi)康?br>5.4.2 實(shí)驗(yàn)數(shù)據(jù)
5.4.3 實(shí)驗(yàn)過程
5.4.4 數(shù)據(jù)分析
5.4.5 實(shí)驗(yàn)結(jié)論
5.5 小結(jié)
第6章 領(lǐng)域限定網(wǎng)絡(luò)檢索相似度算法研究
6.1 Web-PMI算法的改進(jìn)思路
6.2 算法改進(jìn)設(shè)計(jì)
6.2.1 基于領(lǐng)域特征的檢索式構(gòu)造
6.2.2 基于命中數(shù)的術(shù)語相似度計(jì)算
6.3 算法實(shí)現(xiàn)
6.3.1 算法結(jié)構(gòu)
6.3.2 搜索引擎的選擇
6.4 算法評測
6.4.1 實(shí)驗(yàn)?zāi)康?br>6.4.2 實(shí)驗(yàn)數(shù)據(jù)
6.4.3 實(shí)驗(yàn)過程
6.4.4 數(shù)據(jù)分析
6.4.5 實(shí)驗(yàn)結(jié)論
6.5 小結(jié)
第7章 基于機(jī)器學(xué)習(xí)的術(shù)語相似度集成計(jì)算模型
7.1 集成計(jì)算模型的提出
7.2 集成計(jì)算設(shè)計(jì)
7.2.1 學(xué)習(xí)階段模型設(shè)計(jì)
7.2.2 計(jì)算階段框架設(shè)計(jì)
7.3 集成計(jì)算實(shí)現(xiàn)
7.3.1 相似度網(wǎng)絡(luò)初始化
7.3.2 相似度網(wǎng)絡(luò)的檢索和推導(dǎo)機(jī)制
7.3.3 語詞相似度計(jì)算
7.3.4 句法相似度計(jì)算
7.3.5 語境相似度計(jì)算
7.3.6 搜索引擎相似度計(jì)算
7.3.7 相似度指標(biāo)的SVM集成
7.4 集成計(jì)算評測
7.4.1 實(shí)驗(yàn)?zāi)康?br>7.4.2 實(shí)驗(yàn)數(shù)據(jù)
7.4.3 實(shí)驗(yàn)過程
7.4.4 數(shù)據(jù)分析
7.4.5 實(shí)驗(yàn)結(jié)論
7.5 小結(jié)
第8章 結(jié)束語
參考文獻(xiàn)