關(guān)于我們
書單推薦
新書推薦
|
《漢語主題詞表》構(gòu)建研究 !稘h語主題詞表》是我國第一部大型綜合性敘詞表,是專家與群眾相結(jié)合,實(shí)行社會主義大協(xié)作的產(chǎn)物,是我國情報(bào)界與圖書館界于20世紀(jì)70年代協(xié)作的集體智慧結(jié)晶,并于1985年獲得國家科學(xué)技術(shù)進(jìn)步獎二等獎。 隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,大數(shù)據(jù)、云計(jì)算、機(jī)器智能對文本數(shù)據(jù)處理提出了更豐富的應(yīng)用需求,對知識組織提出了更細(xì)粒度的計(jì)算關(guān)聯(lián)要求,如進(jìn)行切詞、信息抽取、聚類、詞頻統(tǒng)計(jì)、情感分析等文本信息處理,在電子政務(wù)、電子商務(wù)的信息搜索中實(shí)現(xiàn)知識自動分類、智能推理和語義聚類,在各類知識管理中實(shí)現(xiàn)不同粒度的智能查詢、領(lǐng)域監(jiān)測、知識挖掘,在信息檢索發(fā)現(xiàn)中實(shí)現(xiàn)分類導(dǎo)航和語義分面、英漢跨語言檢索和輔助機(jī)器翻譯等功能。這些都需要借助主題詞表進(jìn)行知識組織和文本處理,即《漢語主題詞表》的應(yīng)用將超越傳統(tǒng)主題標(biāo)引,跨出傳統(tǒng)圖書情報(bào)檔案領(lǐng)域,融入整個(gè)文本信息處理和知識組織過程之中,應(yīng)用于情報(bào)檢索、搜索引擎、知識管理、電子政務(wù)、電子商務(wù)、數(shù)字出版、數(shù)據(jù)挖掘、知識計(jì)算等領(lǐng)域,發(fā)揮其更加廣泛、更深層次和更有價(jià)值的作用,這就需要跨出圖書情報(bào)視野,借助大數(shù)據(jù)、云計(jì)算和機(jī)器智能等新動能,放眼整個(gè)知識內(nèi)容行業(yè)和文本信息處理領(lǐng)域,不斷完善《漢語主題詞表》的內(nèi)在結(jié)構(gòu)和外在功能,為《漢語主題詞表》注入新鮮血液和活力,煥發(fā)數(shù)字環(huán)境下《漢語主題詞表》的生命力。為此,中國科學(xué)技術(shù)信息研究所于2009年啟動《漢語主題詞表》在網(wǎng)絡(luò)環(huán)境下的重構(gòu)與修訂工作,并分工程技術(shù)卷、自然科學(xué)卷、生物醫(yī)學(xué)農(nóng)業(yè)卷和社會科學(xué)卷依次展開修訂。 為此,我們在中國科學(xué)技術(shù)信息研究所信息資源中心(國家工程技術(shù)圖書館)成立了《漢語主題詞表》研究編制專項(xiàng)組。我們在剖析和正視傳統(tǒng)《漢語主題詞表》的內(nèi)在問題和外在機(jī)遇之后,通過分析新時(shí)期知識組織和文本處理對《漢語主題詞表》的需求,制定新型《漢語主題詞表》編制的技術(shù)路線,編制新型《漢語主題詞表》的重構(gòu)和修訂方案,收集與加工了包括文獻(xiàn)關(guān)鍵詞、用戶檢索詞、各類百科全書、專業(yè)術(shù)語、相關(guān)專業(yè)及綜合敘詞表等在內(nèi)的術(shù)語資源,建立收詞量達(dá)400萬條的基礎(chǔ)詞庫;研究詞匯概念的分類方法,構(gòu)建概念與文獻(xiàn)導(dǎo)航的范疇體系;結(jié)合認(rèn)知計(jì)算和機(jī)器智能應(yīng)用需要,制定《漢語主題詞表》編制標(biāo)準(zhǔn)和規(guī)則,開發(fā)基于標(biāo)準(zhǔn)規(guī)則的敘詞表協(xié)同編制管理平臺;建立專業(yè)術(shù)語選詞、專業(yè)概念歸類與同義詞歸并、關(guān)系建立、范疇劃分、邏輯關(guān)系驗(yàn)證、英文審定、增加參考注釋等工作流程;采取先選詞再分編最后融合、先選詞再集成最后集中編制等多種方式,展開不同領(lǐng)域主題詞表的編制工作。目前,《漢語主題詞表(工程技術(shù)卷)》《漢語主題詞表(自然科學(xué)卷)》已經(jīng)修訂完成并出版,正聯(lián)合相關(guān)單位編制《漢語主題詞表(生物醫(yī)學(xué)農(nóng)業(yè)卷)》。 網(wǎng)絡(luò)環(huán)境下《漢語主題詞表》的重構(gòu)與修訂是新時(shí)期全國圖書情報(bào)界再次集體協(xié)作的典范項(xiàng)目,是網(wǎng)絡(luò)在線編制敘詞表的協(xié)同示范。《漢語主題詞表》建設(shè)和應(yīng)用具有深厚的理論基礎(chǔ),網(wǎng)絡(luò)環(huán)境下《漢語主題詞表》既可以運(yùn)用于知識組織與知識關(guān)聯(lián),又可以支撐知識計(jì)算與知識服務(wù),通過有機(jī)地嵌入各類信息系統(tǒng),實(shí)現(xiàn)基于《漢語主題詞表》的機(jī)器標(biāo)注和語義關(guān)聯(lián),直接應(yīng)用到主題標(biāo)引、知識檢索、自動聚類、熱點(diǎn)追蹤、知識鏈接、術(shù)語服務(wù)、科研關(guān)系網(wǎng)絡(luò)構(gòu)建等多個(gè)方面。我們一方面期待與業(yè)界同行繼續(xù)推進(jìn)《漢語主題詞表》的基礎(chǔ)建設(shè)和持續(xù)維護(hù)更新;另一方面期盼社會各界全面實(shí)施網(wǎng)絡(luò)環(huán)境下《漢語主題詞表》的應(yīng)用及實(shí)踐,不斷推進(jìn)知識資源的有序組織和知識服務(wù)的深層次發(fā)展,服務(wù)于信息精確檢索和數(shù)據(jù)智能挖掘。
你還可能感興趣
我要評論
|