《人際網(wǎng)絡(luò)環(huán)境下的信息檢索/21世紀(jì)高等學(xué)校教材》改變現(xiàn)行大多數(shù)教材以傳統(tǒng)文獻(xiàn)形態(tài)展開敘述的結(jié)構(gòu)體系,遵循現(xiàn)代信息檢索技術(shù)發(fā)展的規(guī)律,以傳統(tǒng)文獻(xiàn)、數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)及機(jī)構(gòu)四類信息源作為主干結(jié)構(gòu),既包含原有內(nèi)容,又有效容納了信息源的新發(fā)展!度穗H網(wǎng)絡(luò)環(huán)境下的信息檢索/21世紀(jì)高等學(xué)校教材》系統(tǒng)介紹了信息檢索理論與技術(shù),并對(duì)四類信息源的檢索方法做了詳細(xì)介紹,同時(shí),著力透視了迅猛發(fā)展的信息技術(shù)新熱點(diǎn),探索人際網(wǎng)絡(luò)環(huán)境對(duì)信息檢索技術(shù)與觀念的影響,視角新穎,可讀性強(qiáng)。
《人際網(wǎng)絡(luò)環(huán)境下的信息檢索/21世紀(jì)高等學(xué)校教材》可作為研究生、本科生信息檢索與利用課程的教材,也可供圖書情報(bào)工作者、信息管理工作者參考。也.適合于普通讀者作為提高信息素養(yǎng)的讀本。
3)信息檢索的類型
討論檢索類型,先要了解檢索的一種特殊類型,即全文數(shù)據(jù)庫(kù),它是一次信息和二次信息的綜合體。在檢索結(jié)果中,全文數(shù)據(jù)庫(kù)有直接的全文鏈接。
按存儲(chǔ)與檢索對(duì)象劃分,信息檢索可以分為文獻(xiàn)檢索、數(shù)據(jù)檢索、事實(shí)檢索。其中數(shù)據(jù)檢索和事實(shí)檢索是確定性的檢索,檢索結(jié)果可以直接利用,一般通過(guò)三次信息源來(lái)完成;文獻(xiàn)檢索是一種相關(guān)性檢索,檢索結(jié)果是文獻(xiàn)信息的線索,一般通過(guò)二次信息來(lái)實(shí)現(xiàn)。以上三種信息檢索類型的主要區(qū)別在于:數(shù)據(jù)檢索和事實(shí)檢索是要檢索出包含在文獻(xiàn)中的信息本身,而文獻(xiàn)檢索只要檢索出包含所需要信息的文獻(xiàn)即可。
按存儲(chǔ)的載體和實(shí)現(xiàn)查找的技術(shù)手段為標(biāo)準(zhǔn)劃分,信息檢索可分為手工檢索、機(jī)械檢索、計(jì)算機(jī)檢索。其中發(fā)展比較迅速的計(jì)算機(jī)檢索是數(shù)據(jù)庫(kù)與網(wǎng)絡(luò)信息檢索,也即數(shù)據(jù)庫(kù)與網(wǎng)絡(luò)信息搜索,是指互聯(lián)網(wǎng)用戶在網(wǎng)絡(luò)終端通過(guò)特定的網(wǎng)絡(luò)搜索工具或是通過(guò)瀏覽的方式查找并獲取信息的行為。
按檢索途徑劃分,信息檢索還可分為直接檢索、間接檢索。
4)人際網(wǎng)絡(luò)時(shí)代信息檢索相關(guān)熱點(diǎn)
。1)智能檢索或知識(shí)檢索
傳統(tǒng)的全文檢索技術(shù)基于關(guān)鍵詞匹配進(jìn)行檢索,往往存在查不全、查不準(zhǔn)、檢索質(zhì)量不高的現(xiàn)象,特別是在網(wǎng)絡(luò)信息時(shí)代,利用關(guān)鍵詞匹配很難滿足人們檢索的要求。而智能檢索利用分詞詞典、同義詞典、同音詞典改善檢索效果,比如用戶查詢“計(jì)算機(jī)”,與“電腦”相關(guān)的信息也能檢索出來(lái);進(jìn)一步還可在知識(shí)層面或者說(shuō)概念層面上輔助查詢,通過(guò)主題詞典、上下位詞典、相關(guān)同級(jí)詞典形成一個(gè)知識(shí)體系或概念網(wǎng)絡(luò),給予用戶智能知識(shí)提示,最終幫助用戶獲得最佳的檢索效果,比如用戶可以進(jìn)一步縮小查詢范圍至“微機(jī)”、“服務(wù)器”或擴(kuò)大查詢至“信息技術(shù)”或查詢相關(guān)的“電子技術(shù)”、“軟件”、“計(jì)算機(jī)應(yīng)用”等范疇。另外,智能檢索還包括歧義信息和檢索處理,如“蘋果”,究竟是指水果還是電腦品牌,又如“華人”與“中華人民共和國(guó)”的區(qū)分,將通過(guò)歧義知識(shí)描述庫(kù)、全文索引、用戶檢索上下文分析以及用戶相關(guān)性反饋等技術(shù)結(jié)合處理,高效、準(zhǔn)確地反饋給用戶最需要的信息。
(2)數(shù)據(jù)(知識(shí))挖掘
數(shù)據(jù)(知識(shí))挖掘主要指文本挖掘技術(shù)的發(fā)展,目的是幫助人們更好的發(fā)現(xiàn)、組織、表示信息,提取知識(shí),滿足信息檢索的高層次需要,包括摘要、分類(聚類)和相似性檢索等方面。自動(dòng)摘要就是利用計(jì)算機(jī)自動(dòng)地從原始文獻(xiàn)中提取文摘。在信息檢索中,自動(dòng)摘要有助于用戶快速評(píng)價(jià)檢索結(jié)果的相關(guān)程度;在信息服務(wù)中,自動(dòng)摘要有助于多種形式的內(nèi)容分發(fā),如發(fā)往PDA、手機(jī)等輕應(yīng)用終端。相似性檢索技術(shù)基于文檔內(nèi)容特征檢索與其相似或相關(guān)的文檔,是實(shí)現(xiàn)用戶個(gè)性化相關(guān)反饋的基礎(chǔ),也可用于去重分析。自動(dòng)分類可基于統(tǒng)計(jì)或規(guī)則,經(jīng)過(guò)計(jì)算機(jī)分析形成預(yù)定義分類樹,再根據(jù)文檔的內(nèi)容特征將其歸類;自動(dòng)聚類則是根據(jù)文檔內(nèi)容的相關(guān)程度進(jìn)行分組歸并。自動(dòng)分類(聚類)在信息組織、導(dǎo)航方面非常有用。
。3)異構(gòu)信息整合檢索和全息檢索
在信息檢索分布化和網(wǎng)絡(luò)化的趨勢(shì)下,信息檢索系統(tǒng)的開放性和集成性要求越來(lái)越高,需要能夠檢索和整合不同來(lái)源和結(jié)構(gòu)的信息。這是異構(gòu)信息檢索技術(shù)發(fā)展的基點(diǎn),包括支持各種格式化文件,如TEXT、HTML、XML、RTF、MS Office、PDF、PS2/PS、MARC、IS0 2709等處理和檢索;支持多語(yǔ)種信息的檢索;支持結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一處理;和關(guān)系數(shù)據(jù)庫(kù)檢索的無(wú)縫集成以及其他開放檢索接口的集成等。所謂全息檢索,就是支持一切格式和方式的檢索。從實(shí)踐來(lái)講,發(fā)展到異構(gòu)信息整合檢索的層面,基于自然語(yǔ)言理解的人機(jī)交互以及多媒體信息檢索整合等方面尚有待取得進(jìn)一步突破。
另外,從工程實(shí)踐角度,綜合采用內(nèi)存和外部存儲(chǔ)的多級(jí)緩存、分布式群集和負(fù)載均衡技術(shù)也是信息檢索技術(shù)發(fā)展的重要方面。
隨著互聯(lián)網(wǎng)的普及和電子商務(wù)的發(fā)展,企業(yè)和個(gè)人可獲取、需處理的信息量呈爆發(fā)式增長(zhǎng),而且其中絕大部分都是非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。內(nèi)容管理的重要性日益凸現(xiàn),而信息檢索作為內(nèi)容管理的核心支撐技術(shù),隨著內(nèi)容管理的發(fā)展和普及,亦將應(yīng)用到各個(gè)領(lǐng)域,成為人們?nèi)粘9ぷ魃畹拿芮谢锇椤?br />
在新時(shí)期,信息檢索呈現(xiàn)智能化、可視化、簡(jiǎn)單化、多樣化、個(gè)性化、商業(yè)化等發(fā)展趨勢(shì)。
5)信息檢索的意義
。1)充分利用和掌握有效的信息資源,有利于舉一反三,擴(kuò)大知識(shí)視野,學(xué)好專業(yè)知識(shí)和技能;
。2)掌握科學(xué)的信息檢索方法是獲取新知識(shí)的捷徑,可以使自己在廣闊的知識(shí)領(lǐng)域中不斷更新知識(shí),更好地適應(yīng)社會(huì)發(fā)展的需求;
。3)掌握科學(xué)的信息檢索方法可以縮短查詢信息的時(shí)間,獲取更多的信息,提高工作效率,有利于就業(yè)后了解市場(chǎng)同類產(chǎn)品及銷售情況,積極參與市場(chǎng)競(jìng)爭(zhēng);
。4)有利于為個(gè)人、企業(yè)提供競(jìng)爭(zhēng)情報(bào)和相關(guān)信息,為決策作參考。
……