統(tǒng)計自然語言處理(第2版)(中文信息處理叢書)
定 價:85 元
- 作者:宗成慶 著
- 出版時間:2013/8/1
- ISBN:9787302319115
- 出 版 社:清華大學(xué)出版社
- 中圖法分類:TP391
- 頁碼:570
- 紙張:膠版紙
- 版次:2
- 開本:16開
《中文信息處理叢書:統(tǒng)計自然語言處理(第2版)》全面介紹了統(tǒng)計自然語言處理的基本概念、理論方法和最新研究進展,內(nèi)容包括形式語言與自動機及其在自然語言處理中的應(yīng)用、語言模型、隱馬爾可夫模型、語料庫技術(shù)、漢語自動分詞與詞性標注、句法分析、詞義消歧、篇章分析、統(tǒng)計機器翻譯、語音翻譯、文本分類、信息檢索與問答系統(tǒng)、自動文摘和信息抽取、口語信息處理與人機對話系統(tǒng)等,既有對基礎(chǔ)知識和理論模型的介紹,也有對相關(guān)問題的研究背景、實現(xiàn)方法和技術(shù)現(xiàn)狀的詳細闡述。
《中文信息處理叢書:統(tǒng)計自然語言處理(第2版)》可作為高等院校計算機、信息技術(shù)等相關(guān)專業(yè)的高年級本科生或研究生的教材或參考書,也可供從事自然語言處理、數(shù)據(jù)挖掘和人工智能等研究的相關(guān)人員參考。
宗成慶,中國科學(xué)院自動化所研究員、博士生導(dǎo)師。1998年3月畢業(yè)于中國科學(xué)院計算技術(shù)研究所,獲博士學(xué)位。1998年5月至2000年4月在中國科學(xué)院自動化研究所從事博士后研究,博士后出站以后留在自動化所工作至今。2006年至2013年擔(dān)任模式識別國家重點實驗室副主任。曾于1999年和2001年兩次在日本國際電氣通信基礎(chǔ)技術(shù)研究所(ATR)做客座研究員。2004年10月至2005年2月在法國格勒諾布爾(Grenoble)信息與應(yīng)用數(shù)學(xué)研究院(IMAG)做短期高訪。
主要從事自然語言處理、機器翻譯和文本分類等相關(guān)技術(shù)的研究和教學(xué)工作,作為項目負責(zé)人主持國家自然科學(xué)基金項目、國家“863”項目、國家支撐計劃項目和中國科 宗成慶,中國科學(xué)院自動化所研究員、博士生導(dǎo)師。1998年3月畢業(yè)于中國科學(xué)院計算技術(shù)研究所,獲博士學(xué)位。1998年5月至2000年4月在中國科學(xué)院自動化研究所從事博士后研究,博士后出站以后留在自動化所工作至今。2006年至2013年擔(dān)任模式識別國家重點實驗室副主任。曾于1999年和2001年兩次在日本國際電氣通信基礎(chǔ)技術(shù)研究所(ATR)做客座研究員。2004年10月至2005年2月在法國格勒諾布爾(Grenoble)信息與應(yīng)用數(shù)學(xué)研究院(IMAG)做短期高訪。
主要從事自然語言處理、機器翻譯和文本分類等相關(guān)技術(shù)的研究和教學(xué)工作,作為項目負責(zé)人主持國家自然科學(xué)基金項目、國家“863”項目、國家支撐計劃項目和中國科學(xué)院國際合作項目等10余項,發(fā)表論文100余篇,其中在Computational Linguistics、IEEE Intelligent Systems、IEEE TASLP. Information Sciences和ACL、COLING、EMNLP等權(quán)威國際期刊和頂級學(xué)術(shù)會議上發(fā)表論文40余篇,出版專著和譯著各一部,獲國家發(fā)明專利十余項。指導(dǎo)開發(fā)的多語言機器翻譯系統(tǒng)已經(jīng)在多個國家特定領(lǐng)域獲得實際應(yīng)用,并多次在國際評測中取得優(yōu)異成績。
目前任國際計算語言學(xué)委員會(International Committee on Computational Linguistics, ICCL)委員、國際計算語言學(xué)學(xué)會(ACL)漢語特別興趣組(SIGHAN)候任主席(Chair-Elec),中國中文信息學(xué)會常務(wù)理事、中國人工智能學(xué)會理事、中國計算機學(xué)會中文信息技術(shù)專委會副主任,曾于2008年至2012年期間擔(dān)任亞洲自然語言處理聯(lián)合會(AFNLP)執(zhí)行理事。目前還擔(dān)任國際學(xué)術(shù)期刊ACM TALIP副主編、IJCPOL副主編、IEEEIntelligent systems編委、Machine Translation編委、JCST編委和《自動化學(xué)報》副主編等多種學(xué)術(shù)職務(wù),曾多次在ACL、COLING和EMNLP等頂級學(xué)術(shù)會議上擔(dān)任重要職務(wù)。2008年獲中國科學(xué)院集中教學(xué)突出貢獻獎,2010年獲中國科學(xué)院“朱李月華優(yōu)秀教師”獎。享受政府特殊津貼。
第1章 緒論
1.1 基本概念
1.1.1 語言學(xué)與語音學(xué)
1.1.2 自然語言處理
1.1.3 關(guān)于“理解”的標準
1.2 自然語言處理研究的內(nèi)容和面臨的困難
1.2.1 自然語言處理研究的內(nèi)容
1.2.2 自然語言處理涉及的幾個層次
1.2.3 自然語言處理面臨的困難
1.3 自然語言處理的基本方法及其發(fā)展
1.3.1 自然語言處理的基本方法
1.3.2 自然語言處理的發(fā)展
1.4 自然語言處理的研究現(xiàn)狀
1.5 本書的內(nèi)容安排
第1章 緒論
1.1 基本概念
1.1.1 語言學(xué)與語音學(xué)
1.1.2 自然語言處理
1.1.3 關(guān)于“理解”的標準
1.2 自然語言處理研究的內(nèi)容和面臨的困難
1.2.1 自然語言處理研究的內(nèi)容
1.2.2 自然語言處理涉及的幾個層次
1.2.3 自然語言處理面臨的困難
1.3 自然語言處理的基本方法及其發(fā)展
1.3.1 自然語言處理的基本方法
1.3.2 自然語言處理的發(fā)展
1.4 自然語言處理的研究現(xiàn)狀
1.5 本書的內(nèi)容安排
第2章 預(yù)備知識
2.1 概率論基本概念
2.1.1 概率
2.1.2 最大似然估計
2.1.3 條件概率
2.1.4 貝葉斯法則
2.1.5 隨機變量
2.1.6 二項式分布
2.1.7 聯(lián)合概率分布和條件概率分布
2.1.8 貝葉斯決策理論
2.1.9 期望和方差
2.2 信息論基本概念
2.2.1 熵
2.2.2 聯(lián)合熵和條件熵
2.2.3 互信息
2.2.4 相對熵
2.2.5 交叉熵
2.2.6 困惑度
2.2.7 噪聲信道模型
2.3 支持向量機
2.3.1 線性分類
2.3.2 線性不可分
2.3.3 構(gòu)造核函數(shù)
第3章 形式語言與自動機
3.1 基本概念
3.1.1 圖
3.1.2 樹
3.1.3 字符串
3.2 形式語言
3.2.1 概述
3.2.2 形式語法的定義
3.2.3 形式語法的類型
3.2.4 CFG識別句子的派生樹表示
3.3 自動機理論
3.3.1 有限自動機
3.3.2 正則文法與自動機的關(guān)系
3.3.3 上下文無關(guān)文法與下推自動機
3.3.4 圖靈機
3.3.5 線性界限自動機
3.4 自動機在自然語言處理中的應(yīng)用
3.4.1 單詞拼寫檢查
3.4.2 單詞形態(tài)分析
3.4.3 詞性消歧
第4章 語料庫與語言知識庫
4.1 語料庫技術(shù)
4.1.1 概述
4.1.2 語料庫語言學(xué)的發(fā)展
4.1.3 語料庫的類型
4.1.4 漢語語料庫建設(shè)中的問題
4.1.5 典型語料庫介紹
……
第5章 語言模型
第6章 概率圖模型
第7章 自動分詞、命名實體識別與詞性標注
第8章 句法分析
第9章 語義分析
第10章 篇章分析
第11章 統(tǒng)計機器翻譯
第12章 語音翻譯
第13章 文本分類與情感分類
第14章 信息檢索與問答系統(tǒng)
第15章 自動文摘與信息抽取
第16章 口語信息處理與人機對話系統(tǒng)
參考文獻
自然語言處理及其相關(guān)領(lǐng)域的國際會議
名詞術(shù)語索引