關(guān)于我們
書單推薦
新書推薦
|
自然語言處理方法——使用Python基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)發(fā)掘文本數(shù)據(jù) 本書系統(tǒng)介紹了基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)對文本數(shù)據(jù)進(jìn)行挖掘和分析的方法,從文本分類、語音識別、主題建模、文本總結(jié)、文本生成、情感分析等多個(gè)自然語言處理的應(yīng)用角度出發(fā),對自然語言處理進(jìn)行了深入解讀,通過大量Python代碼幫助讀者快速學(xué)習(xí)并實(shí)現(xiàn)基本的甚至較高級的自然語言處理技術(shù)。 全書共六章。第1章介紹數(shù)據(jù)的收集和提取,包括從網(wǎng)頁、PDF、Word、HTML、JSON中收集數(shù)據(jù);第2章介紹文本數(shù)據(jù)的處理,包括形式轉(zhuǎn)換、刪除標(biāo)點(diǎn)符號、拼寫校正、詞干提取、詞形還原等;第3章介紹文本特征工程,采用的技術(shù)包括One Hot編碼、統(tǒng)計(jì)向量化、N-grams、哈希向量化、共生矩陣等;第4章介紹高級自然語言處理,包括文本相似度計(jì)算、詞性標(biāo)注、提取實(shí)體、提取主題、情感分析、語音和文本互轉(zhuǎn)等;第5章介紹自然語言處理的行業(yè)應(yīng)用,如多類分類、文本數(shù)據(jù)總結(jié)、文檔聚類、自然語言處理在搜索引擎中的應(yīng)用等;第6章介紹基于深度學(xué)習(xí)的自然語言處理,通過深度學(xué)習(xí)實(shí)現(xiàn)信息檢索、文本分類和單詞預(yù)測。 本書注重理論與實(shí)踐相結(jié)合,具有較好的實(shí)用性,可為自然語言處理或機(jī)器學(xué)習(xí)的相關(guān)從業(yè)人員以及愛好者提供業(yè)務(wù)學(xué)習(xí)指導(dǎo),也可為Python程序員提供技術(shù)參考,還可為高等院校相關(guān)專業(yè)的本科生和研究生提供學(xué)習(xí)參考。
你還可能感興趣
我要評論
|