語言智能處理一直是人工智能領(lǐng)域的重要研究方向之一。本書按照研究歷程與現(xiàn)狀、關(guān)鍵技術(shù)與方法、發(fā)展趨勢(shì)與展望的基本脈絡(luò),重點(diǎn)介紹了語言智能處理中的語言模型與知識(shí)表示、語言分析技術(shù)、語言情感分類、自然語言生成技術(shù)、自動(dòng)問答與人機(jī)對(duì)話、機(jī)器翻譯、信息檢索與信息推薦等主題。本書所描述的內(nèi)容涉及人們?nèi)粘I钪械恼鎸?shí)應(yīng)用場(chǎng)景,理論與實(shí)踐相結(jié)合,所探討的技術(shù)具有代表性,便于讀者理解與融會(huì)貫通。本書既可作為高等院校相關(guān)專業(yè)師生的教學(xué)參考書,也可作為人工智能領(lǐng)域語言智能處理研究人員和廣大愛好者的技術(shù)參考書。
黃河燕:1963年10月生,籍貫湖南。1986年1月加入中國(guó)共產(chǎn)黨,1989年3月參加工作。1983年畢業(yè)于武漢測(cè)繪科技大學(xué)計(jì)算機(jī)系獲學(xué)士學(xué)位,1986年畢業(yè)于國(guó)防科技大學(xué)計(jì)算機(jī)系獲碩士學(xué)位,1989年畢業(yè)于中國(guó)科學(xué)院計(jì)算技術(shù)研究所獲博士學(xué)位,后留所工作,先后任助理研究員、副研究員、研究員;1997年至2009年在中科院計(jì)算機(jī)語言信息工程研究中心任副主任、研究員并先后兼任中科院華建集團(tuán)黨委委員、副書記,2009年至今任北京理工大學(xué)計(jì)算機(jī)學(xué)院院長(zhǎng)、教授,兼北京市海量語言信息處理與云計(jì)算應(yīng)用工程技術(shù)研究中心主任及中-德語言信息處理聯(lián)合實(shí)驗(yàn)室主任;現(xiàn)為國(guó)家"863計(jì)劃”主題專家組成員、中國(guó)人工智能學(xué)會(huì)及中國(guó)中文信息學(xué)會(huì)副理事長(zhǎng)、教育部計(jì)算機(jī)教學(xué)指導(dǎo)委員會(huì)委員、北京市學(xué)位委員會(huì)委員。主持承擔(dān)了國(guó)家自科基金重點(diǎn)項(xiàng)目、"973計(jì)劃”課題、"863計(jì)劃”項(xiàng)目等20多項(xiàng)國(guó)家級(jí)科研攻關(guān)項(xiàng)目,獲得了國(guó)家科技進(jìn)步一等獎(jiǎng)等8項(xiàng)國(guó)家級(jí)和省部級(jí)獎(jiǎng)勵(lì),1997年享受國(guó)務(wù)院政府特殊津貼,2014年當(dāng)選全國(guó)優(yōu)秀科技工作者。
第1章緒論
11語言智能處理簡(jiǎn)介
12人工智能與語言智能處理
13基于神經(jīng)網(wǎng)絡(luò)的自然語言處理
14語言智能處理的應(yīng)用
15本書的組織結(jié)構(gòu)
第2章語言模型與知識(shí)表示
21語言模型
211概述
212n-gram語言模型
213估計(jì)
214評(píng)價(jià)指標(biāo)
215數(shù)據(jù)稀疏與齊夫定律
216計(jì)數(shù)平滑方法
217神經(jīng)網(wǎng)絡(luò)語言模型
218小結(jié)
22詞向量構(gòu)造方法
221詞向量(Word Embedding)構(gòu)造方法概述
222基于全局統(tǒng)計(jì)信息的Word Embedding構(gòu)造方法
223基于預(yù)測(cè)任務(wù)的Word Embedding構(gòu)造方法
224利用外部信息的Word Embedding構(gòu)造方法
225方法評(píng)價(jià)
226Word Embedding的應(yīng)用
227研究展望
23知識(shí)圖譜表示學(xué)習(xí)
231表示學(xué)習(xí)的基本概念
232表示學(xué)習(xí)的典型應(yīng)用
233表示學(xué)習(xí)的主要優(yōu)點(diǎn)
234表示學(xué)習(xí)的典型方法
參考文獻(xiàn)
第3章語言分析技術(shù)
31詞法分析
311概述
312自動(dòng)分詞
313詞性標(biāo)注
314分詞和詞性標(biāo)注的聯(lián)合模型
32句法分析
321概述
322句法結(jié)構(gòu)分析
323依存關(guān)系分析
33篇章分析
331概述
332篇章分析相關(guān)理論及標(biāo)注語料庫(kù)
333篇章分析方法
34語義分析
341概述
342詞匯級(jí)語義分析
343句子級(jí)語義分析
344篇章級(jí)語義分析
345基于神經(jīng)網(wǎng)絡(luò)模型的語義分析
346語義分析評(píng)測(cè)任務(wù)
347未來發(fā)展趨勢(shì)
參考文獻(xiàn)
第4章語言情感分類
41情感描述的主要方法
411情感的類別表示法
412情感的維度表示法
42情感識(shí)別模型
421文本情感計(jì)算
422語音情感計(jì)算
43當(dāng)前語言情感識(shí)別的挑戰(zhàn)
431領(lǐng)域依賴
432語料庫(kù)的建設(shè)
433多模態(tài)融合
434細(xì)粒度情感計(jì)算
參考文獻(xiàn)
第5章自然語言生成技術(shù)
51概述
52序列到序列模型
521基本原理和算法框架
522模型實(shí)現(xiàn)與注意力機(jī)制
523小結(jié)
53變分自編碼器
531基本原理
532應(yīng)用場(chǎng)景
533高級(jí)話題
54生成式對(duì)抗網(wǎng)絡(luò)
541基本原理和算法框架
542生成式對(duì)抗網(wǎng)絡(luò)的特點(diǎn)
543相關(guān)模型
544小結(jié)
55基于預(yù)訓(xùn)練語言模型的生成方法
551預(yù)訓(xùn)練語言模型
552拓展話題
553小結(jié)
56本章小結(jié)
參考文獻(xiàn)
第6章自動(dòng)問答與人機(jī)對(duì)話
61知識(shí)庫(kù)問答
611基于語義解析的知識(shí)庫(kù)問答
612基于神經(jīng)網(wǎng)絡(luò)的端到端知識(shí)庫(kù)問答
62機(jī)器閱讀理解
621任務(wù)介紹
622機(jī)器閱讀理解系統(tǒng)框架
623機(jī)器閱讀理解系統(tǒng)的核心組件
624代表性機(jī)器閱讀理解模型
625總結(jié)與展望
63人機(jī)對(duì)話系統(tǒng)
631面向任務(wù)型的對(duì)話系統(tǒng)
632面向非任務(wù)型的聊天系統(tǒng)
64總結(jié)與未來的挑戰(zhàn)
參考文獻(xiàn)
第7章機(jī)器翻譯
71概況
711任務(wù)的定義與研究的意義
712發(fā)展的歷史
72神經(jīng)機(jī)器翻譯
721核心模型
722關(guān)鍵技術(shù)
73數(shù)據(jù)與評(píng)測(cè)
731數(shù)據(jù)集
732技術(shù)評(píng)測(cè)
74開源工具
741統(tǒng)計(jì)機(jī)器翻譯開源工具
742神經(jīng)機(jī)器翻譯開源工具
75總結(jié)與展望
參考文獻(xiàn)
第8章信息檢索與信息推薦
81概述
811信息檢索的概念與發(fā)展
812信息推薦的概念與發(fā)展
813信息檢索和信息推薦的聯(lián)系和區(qū)別
82信息檢索與信息推薦的相關(guān)技術(shù)
821信息檢索部分前沿技術(shù)
822信息推薦部分前沿技術(shù)
823信息檢索與信息推薦領(lǐng)域的相關(guān)資源
83相關(guān)技術(shù)的產(chǎn)業(yè)應(yīng)用
831典型的應(yīng)用產(chǎn)品
832信息檢索技術(shù)的應(yīng)用情況
833信息推薦技術(shù)的應(yīng)用情況
84發(fā)展趨勢(shì)
參考文獻(xiàn)