本書將語料庫語言學(xué)應(yīng)用于馬克思主義中國化話語體系研究中, 為馬克思主義中國化話語體系研究, 提供了全新的方法, 提供了全新的思路, 開辟了全新的領(lǐng)域。從方法論基礎(chǔ)、基本原則、邏輯思路、基本應(yīng)用等四個層面, 探討了馬克思主義中國化話語語料庫建設(shè)與應(yīng)用的基本問題; 從技術(shù)支持系統(tǒng)、智力支持系統(tǒng)、評估與反饋系統(tǒng)等方面, 探析了馬克思主義中國化話語語料庫建設(shè)的系統(tǒng)架構(gòu); 從詞匯頻率、類符/形符對數(shù)比、詞匯密度、詞長分布、平均句長等層面, 解析了馬克思主義中國化話語語料庫的基本工具; 從詞匯性質(zhì)、詞匯結(jié)構(gòu)、詞匯搭配、詞匯意義等方面, 闡述了馬克思主義中國化話語語料庫的詞匯研究問題。
語言研究的定性與定量之爭由來已久。理性主義者主張使用內(nèi)省和演繹的方法,以語言的概念系統(tǒng)和邏輯框架來論證語言中的普遍性規(guī)律。經(jīng)驗主義者主張使用統(tǒng)計和歸納的方法,以語言的統(tǒng)計數(shù)據(jù)來發(fā)掘語言中隱藏的趨勢性規(guī)律。“工欲善其事,必先利其器!贝四宋覈庞(xùn)。本書將語料庫技術(shù)引入馬克思主義中國化話語體系研究之中,旨在通過對語言的計量學(xué)研究來發(fā)現(xiàn)語言的社會學(xué)本質(zhì)。從這個意義上講,以實踐為基礎(chǔ)的語言社會學(xué)構(gòu)成了馬克思主義中國化話語語料庫建設(shè)與應(yīng)用研究的本體論基礎(chǔ)。
如今,語料庫不僅是以電子形式存儲的自然語言材料的集合體,更重要的是已經(jīng)從語料庫中衍生出把對語言事實的頻率數(shù)據(jù)和數(shù)量模型的定量研究與把對語言事實的邏輯抽象和理論建構(gòu)的定性研究相結(jié)合的哲學(xué)范式。語料庫語言學(xué)和計算語言學(xué)共同構(gòu)成馬克思主義中國化話語語料庫建設(shè)的方法論基礎(chǔ)。真實性、廣泛性、代表性、歷史性成為馬克思主義中國化話語語料庫建設(shè)的基本原則。從項目的設(shè)計與規(guī)劃到語料的采集與取樣,到語料的標注與索引,到語料的檢索與統(tǒng)計,再到網(wǎng)絡(luò)資源共享平臺的建構(gòu),構(gòu)成馬克思主義中國化話語語料庫建設(shè)的邏輯思路。從技術(shù)支持系統(tǒng),到智力支持系統(tǒng),再到評估與反饋系統(tǒng),構(gòu)成馬克思主義中國化話語語料庫建設(shè)的系統(tǒng)架構(gòu)。從詞語頻率到類符/形符對數(shù)比,到詞匯密度,到詞長分布,再到平均句長,構(gòu)成馬克思主義中國化話語語料庫的基本工具。
在語言本質(zhì)研究中使用語料庫已經(jīng)成為標配。從詞匯研究到句子研究,再到語篇分析研究,基于語料庫探討語言形式的統(tǒng)計學(xué)規(guī)律將會大有作為;谡Z料庫探討馬克思主義中國化話語體系的統(tǒng)計學(xué)規(guī)律,并非想要把握超驗的終極實在,而是試圖為馬克思主義中國化話語體系的研究范式提供基本的概念框架和預(yù)設(shè)性前提,或者說是建立起馬克思主義中國化話語體系研究的學(xué)理基礎(chǔ)。基于馬克思主義中國化話語語料庫的詞匯研究將運用實證方法來研究詞匯的性質(zhì)、詞匯的結(jié)構(gòu)、詞匯的搭配、詞匯的意義;隈R克思主義中國化話語語料庫的句子研究通過運用定量方法著手句子的共現(xiàn)頻率分析、句子的語法結(jié)構(gòu)分析、句子的語義成分分析、句子的機器學(xué)習(xí)分析;隈R克思主義中國化話語語料庫的語篇分析研究正隨著計算機技術(shù)的發(fā)展而逐漸走向成熟,探討了基于語料庫的語篇分析的可能性問題、研究范式、理論框架、研究特征、發(fā)展趨勢。
課程教學(xué)與語料庫研究已經(jīng)形成學(xué)科共進關(guān)系。語料庫技術(shù)應(yīng)用于馬克思主義中國化學(xué)科教學(xué)大綱的編制中,將在教學(xué)目的、教學(xué)要求、教學(xué)內(nèi)容、重點難點、教學(xué)進度、日常作業(yè)、考核測評提供頻率數(shù)據(jù)支持,保證教學(xué)大綱編制的均衡性。語料庫技術(shù)應(yīng)用于馬克思主義中國化學(xué)科教材的編寫中,將在教學(xué)素材的選擇、教材結(jié)構(gòu)的規(guī)劃、知識架構(gòu)的布局等提供相對客觀的參數(shù),使學(xué)科教材的編寫有了量化的科學(xué)標準。語料庫技術(shù)應(yīng)用于馬克思主義中國化學(xué)科的課件制作中,將在語料來源、閱讀界面、檢索功能、分析工具、課堂互動、資源共享平臺等方面為課件制作提供先進的技術(shù)手段,實現(xiàn)課件制作的整體優(yōu)化。語料庫技術(shù)應(yīng)用于馬克思主義中國化學(xué)科的網(wǎng)絡(luò)課程建設(shè)中,將推動網(wǎng)絡(luò)課程朝著資源共享性、協(xié)作共創(chuàng)性、時空開放性、媒體多樣性方向發(fā)展,進而使網(wǎng)絡(luò)課程成為知識探索型教學(xué)模式。語料庫技術(shù)應(yīng)用于馬克思主義中國化學(xué)科的教學(xué)辭典編纂中,將使詞目的篩選、詞目的釋義、詞目的搭配、辭典的更新與修訂都能得到真實語言材料的印證和確認,使教學(xué)辭典的編纂更具科學(xué)性。
語料庫是語言翻譯研究的基礎(chǔ)性資源。語料庫翻譯學(xué)采用定量和定性研究相結(jié)合的研究方法,系統(tǒng)分析翻譯語言特征、翻譯規(guī)范、翻譯本質(zhì)等雙語轉(zhuǎn)換規(guī)律。語料庫技術(shù)應(yīng)用于馬克思主義中國化話語體系的翻譯共性研究中,通過詞頻、詞匯密度、平均句長等統(tǒng)計分析,來揭示譯本中語言信息的簡化、顯化、范化、隱化、整齊化處理的趨勢。語料庫技術(shù)應(yīng)用于馬克思主義中國化話語體系的翻譯風(fēng)格研究中,以詞頻、詞匯密度、詞長分布等數(shù)據(jù)函數(shù),來判定譯本或簡潔或冗長,或生動或抽象,或清新或晦澀,或直白或含蓄等翻譯風(fēng)格。語料庫技術(shù)應(yīng)用于馬克思主義中國化話語體系的翻譯教學(xué)研究中,通過對節(jié)點詞的語境檢索,計算出節(jié)點詞的文本等值概率,發(fā)現(xiàn)詞語搭配的語言習(xí)慣,進而發(fā)現(xiàn)譯本的翻譯特點和翻譯規(guī)律。語料庫技術(shù)應(yīng)用于馬克思主義中國化話語體系的機器翻譯研究中,建立起面向機器翻譯的各種各樣的語料庫和自然語言的處理工具、檢索工具、分析工具,通過調(diào)用語料庫的存儲數(shù)據(jù),以譯文的概率模型來達到翻譯的最佳效果。
基于語料庫的話語分析乃是通過對語言符號的詞頻統(tǒng)計、主題詞分析、語義韻分析、索引分析等,為對語言功能的抽象闡釋的定性分析提供數(shù)據(jù)依據(jù),有效地增強話語分析的可信度與說服力。運用詞頻統(tǒng)計方法來探討馬克思主義中國化話語體系的詞匯總體分布狀態(tài),來揭示詞語使用的普遍性情況,進而揭示話語背后的社會問題、權(quán)力關(guān)系、社會文化、意識形態(tài)、社會歷史、意義解釋等。利用語料庫的統(tǒng)計方法來對馬克思主義中國化話語體系的主題詞進行計量分析,來探討文獻資料的語義聯(lián)系和聯(lián)想關(guān)系,進而揭示出社會存在、社會關(guān)系、時代特征的變化。利用語料庫的概率工具對馬克思主義中國化話語體系的關(guān)鍵詞鄰近語境中共現(xiàn)的搭配詞進行統(tǒng)計分析,來發(fā)現(xiàn)潛藏于話語字里行間的隱秘的、隱蔽的、無意識的語義韻意義,探知話語主體的認知態(tài)度、社會立場、情感情緒、價值評價、意識形態(tài)、行為傾向。運用語料庫的索引分析技術(shù)探解馬克思主義中國化話語體系,能夠如實地呈現(xiàn)詞匯性質(zhì)、詞匯邏輯、詞匯意義等方面的表現(xiàn)特征,對詞匯性質(zhì)的定量分析把握其意識形態(tài)立場,對詞匯語法結(jié)構(gòu)研究發(fā)掘其語義聯(lián)系,對詞匯的共現(xiàn)詞研究透視其價值取向。
作為經(jīng)驗主義研究的語料庫研究,通過對語言事實的計量分析,總結(jié)和抽象出語言事實的內(nèi)在規(guī)律性,并以此驗證語言知識的有效性問題。語言研究無論是本體研究還是應(yīng)用研究都起于語言事實,研究有效性的校驗也終于語言事實。馬克思主義中國化話語語料庫建設(shè),本書主張采用經(jīng)驗主義的態(tài)度,著眼于話語資源建設(shè),主要解決語料庫“為何建”、“如何建”以及“如何用”的問題!盀楹谓ā苯鉀Q的是語言研究的文獻來源的客觀性問題,通過馬克思主義中國化話語語料庫建設(shè),及時跟進鮮活的語言事實資料,從而保證馬克思主義中國化話語體系研究的時代性!叭绾谓ā苯鉀Q的是語言事實從語言資源向語言學(xué)資源的轉(zhuǎn)化問題,馬克思主義中國化話語語料庫建設(shè)要著眼于通用性,根據(jù)預(yù)先設(shè)定的語料庫元屬性來確定哪些文本應(yīng)被納入、以何種方式納入、以何種比例納入等都需要精心策劃和精準布局!叭绾斡谩苯鉀Q的是如何為問題研究提供契合的語言事實資源支持問題,馬克思主義中國化話語體系研究要著眼于問題性,根據(jù)語料庫的元屬性,對語料庫進行適當(dāng)裁剪,明確適用范圍,選定計量方式,形成既適合分析,又客觀的話語資源。任何語料庫,無論它有多博大,無論它有多專業(yè),也不可能窮盡學(xué)術(shù)研究所需要的文獻資料,因此,學(xué)術(shù)研究只靠經(jīng)驗數(shù)據(jù)是不夠的。所以,我的基本結(jié)論是,基于直覺的語言研究和基于語料庫的語言研究彼此需要,或者,更為準確地說,應(yīng)該把兩種研究范式的品質(zhì)融為一體。
收起全部↑
鄧伯軍,法學(xué)博士,博士生導(dǎo)師,南京航空航天大學(xué)馬克思主義學(xué)院教授,網(wǎng)絡(luò)空間公共安全研究中心(智庫)主任,研究方向為馬克思主義話語體系。發(fā)表學(xué)術(shù)論文七十余篇,主持和參與國家、省部級課題多項。
序言
引言
一 國內(nèi)外研究現(xiàn)狀述評
二 研究的價值和意義
三 研究的基本架構(gòu)
四 研究的基本方法
五 研究的創(chuàng)新點
第一章 馬克思主義中國化話語語料庫建設(shè)與應(yīng)用的基本問題
第一節(jié) 馬克思主義中國化話語語料庫建設(shè)的方法論基礎(chǔ)
第二節(jié) 馬克思主義中國化話語語料庫建設(shè)的基本原則
第三節(jié) 馬克思主義中國化話語語料庫建設(shè)的邏輯思路
第四節(jié) 馬克思主義中國化話語語料庫的基本應(yīng)用
第二章 馬克思主義中國化話語語料庫建設(shè)的系統(tǒng)架構(gòu)
第一節(jié) 技術(shù)支持系統(tǒng)
第二節(jié) 智力支持系統(tǒng)
第三節(jié) 評估與反饋系統(tǒng)
第三章 馬克思主義中國化話語語料庫的基本工具研究
第一節(jié) 詞語頻率
第二節(jié) 類符/形符對數(shù)比
第三節(jié) 詞匯密度
第四節(jié) 詞長分布
第五節(jié) 平均句長
第四章 基于馬克思主義中國化話語語料庫的詞匯研究
第一節(jié) 詞匯的性質(zhì)
第二節(jié) 詞匯的結(jié)構(gòu)
第三節(jié) 詞匯的搭配
第四節(jié) 詞匯的意義
第五章 基于馬克思主義中國化話語語料庫的句子研究
第一節(jié) 句子的共現(xiàn)頻率分析
第二節(jié) 句子的語法結(jié)構(gòu)分析
第三節(jié) 句子的語義成分分析
第四節(jié) 句子的統(tǒng)計機器學(xué)習(xí)分析
第六章 基于馬克思主義中國化話語語料庫的語篇分析研究
第一節(jié) 可能性問題
第二節(jié) 研究范式
第三節(jié) 理論框架
第四節(jié) 研究特征
第五節(jié) 發(fā)展趨勢
第七章 基于馬克思主義中國化話語語料庫的課程教學(xué)研究
第一節(jié) 教學(xué)大綱的編制
第二節(jié) 教學(xué)教材的編寫
第三節(jié) 教學(xué)課件的制作
第四節(jié) 網(wǎng)絡(luò)課程的建設(shè)
第五節(jié) 教學(xué)辭典的編纂
第八章 基于馬克思主義中國化話語語料庫的語言翻譯研究
第一節(jié) 翻譯共性研究
第二節(jié) 翻譯風(fēng)格研究
第三節(jié) 翻譯教學(xué)研究
第四節(jié) 機器翻譯研究
第九章 基于馬克思主義中國化話語語料庫的話語分析研究
第一節(jié) 詞頻統(tǒng)計研究
第二節(jié) 主題詞統(tǒng)計研究
第三節(jié) 語義韻研究
第四節(jié) 索引分析技術(shù)研究
參考文獻
后記
現(xiàn)代科學(xué)研究是以語言為載體的研究,隨著計算機技術(shù)的發(fā)展,尤其是大數(shù)據(jù)技術(shù)的快速進步,傳統(tǒng)的依靠個體大腦的皓首窮經(jīng)式的抽象研究已經(jīng)遠遠不適應(yīng)形勢的發(fā)展,因此,為順應(yīng)大數(shù)據(jù)時代語言資源智能化處理的需要,建立語料庫以數(shù)字化形式采集知識、匯集知識、挖掘知識、探索知識、發(fā)現(xiàn)知識、創(chuàng)新知識,利用語料庫技術(shù)來解決科學(xué)研究問題。也就是說,知識價值和服務(wù)價值成為語料庫建設(shè)的基本價值取向,知識價值體現(xiàn)為用戶在語料庫中挖掘知識、甄別知識并利用知識來解決問題,服務(wù)價值體現(xiàn)為把知識放在語料庫的服務(wù)平臺上加以利用和開發(fā),提高知識的利用效率。建設(shè)馬克思主義中國化話語語料庫,就是要以語言資源的采集、加工、處理、重組、查新的知識能力為基礎(chǔ),根據(jù)學(xué)術(shù)研究問題和要求,提供有效的知識檢索、知識統(tǒng)計、知識創(chuàng)新等服務(wù)。也就是說,馬克思主義中國化話語語料庫能夠利用先進的技術(shù)手段,對非結(jié)構(gòu)化的語言資源進行加工和利用,這樣就可以高效地從浩如煙海的語言資源中將研究所需要的知識提煉出來,這樣就可以借助龐大的語料庫資源和分類檢索技術(shù),為語言研究提供高級化的信息服務(wù)。因此,要保證馬克思主義中國化話語語料庫的知識服務(wù)的效率和效益,就要建立起馬克思主義中國化話語語料庫知識服務(wù)的評估和反饋機制,運用要素分析法、標準檢驗法、定量評價法、過程分析法等對馬克思主義中國化話語語料庫建設(shè)的技術(shù)支持系統(tǒng)、項目管理系統(tǒng)、項目應(yīng)用系統(tǒng)等進行評估,并且將知識服務(wù)評估的效率和效益結(jié)果反饋給馬克思主義中國化話語語料庫建設(shè)過程,從而使馬克思主義中國化話語語料庫改善和調(diào)節(jié)系統(tǒng)的運行機制,最大限度地發(fā)揮其知識服務(wù)的基本能力。
對馬克思主義中國化話語語料庫建設(shè)的評估方法主要有要素分析法、標準檢驗法、過程分析法等。運用要素分析法對馬克思主義中國化話語語料庫建設(shè)進行評估,主要是從技術(shù)、資源、管理等構(gòu)成要素展開質(zhì)量評價,從而實現(xiàn)對知識服務(wù)質(zhì)量行之有效的控制。就技術(shù)要素而言,要對語料采集技術(shù)、語料加工技術(shù)、語料分析技術(shù)進行質(zhì)量評估,審查采用的技術(shù)能夠在多大程度上解決語料庫建設(shè)的數(shù)據(jù)稀疏問題、語言歧義問題、語言模型的精確度問題等。就資源要素而言,要對語料庫的語料資源進行空間和時間的評估,審核語料資源來源的空間地域的涵蓋指數(shù)和時間脈絡(luò)的覆蓋指數(shù)等問題,解決語料庫建設(shè)的語料來源的均衡性與代表性問題。就管理要素而言,要對語料庫建設(shè)的人、財、物、信息、方法等管理要素進行評估,解決語料庫建設(shè)的計劃、組織、指揮、協(xié)調(diào)、控制等問題。運用標準檢驗法對馬克思主義中國化話語語料庫建設(shè)進行評估,就是要以知識服務(wù)的過程標準、服務(wù)標準、管理標準等對語料庫建設(shè)進行質(zhì)量評價。從過程標準看,要對語料庫建設(shè)的流程制定業(yè)務(wù)標準,要以業(yè)務(wù)的流程標準對語料庫建設(shè)進行評估,來解決語料庫建設(shè)的部門協(xié)調(diào)問題。從服務(wù)標準看,要對語料庫建設(shè)的知識服務(wù)確立服務(wù)標準,以明確性、準確性、可行性的服務(wù)標準對語料庫建設(shè)進行評估,解決語料庫建設(shè)的科學(xué)性問題。從管理標準看,要對語料庫建設(shè)的管理事項確立技術(shù)標準,以量化的、高效的、系統(tǒng)的管理標準對語料庫建設(shè)進行評估,解決語料庫建設(shè)的管理秩序問題。運用過程分析法對馬克思主義中國化話語語料庫建設(shè)進行評估,就是要對語料庫建設(shè)過程的有效性進行科學(xué)評估。依據(jù)技術(shù)的系統(tǒng)性原則、科學(xué)性原則、實用性原則,對語料庫建設(shè)的技術(shù)支持系統(tǒng)的有效性進行評估,尋找對應(yīng)的最佳技術(shù)支持,確保語料庫的技術(shù)支持系統(tǒng)得以最優(yōu)化地利用。依據(jù)管理的系統(tǒng)性原則、整體性原則、協(xié)調(diào)性原則,對語料庫建設(shè)的項目管理系統(tǒng)的有效性進行評估,使管理的各個要素的潛能得以最大程度發(fā)揮,來保證語料庫建設(shè)的項目管理系統(tǒng)通過有效管理實現(xiàn)整體的優(yōu)勢。根據(jù)應(yīng)用的適用性、協(xié)調(diào)性、實用性原則,對語料庫建設(shè)的項目應(yīng)用系統(tǒng)的有效性進行評估,從語料庫應(yīng)用形式發(fā)展出基礎(chǔ)理論知識,進而為語料庫解決實際的問題提供科學(xué)的根據(jù)。
對馬克思主義中國化話語語料庫進行知識服務(wù)效率的評估。知識服務(wù)效率評估是對語料庫建設(shè)所取得的效益與所花費的成本的一種比值的評估。知識服務(wù)效率評估的指標體系主要包括知識獲取能力評估、知識處理能力評估、知識創(chuàng)新能力評估、知識推廣能力評估等。對馬克思主義中國化話語語料庫的知識獲取能力進行評估,通過對語料庫的索引、主題標引、詞的切分、詞性標注、句法分析、語義分析、語用分析等進行評估,來全面地分析語料庫的問題搜索能力,分析提煉能力、測量加工能力等知識獲取能力。對馬克思主義中國化話語語料庫的知識處理能力進行評估,通過對語料庫的詞長、句長、頻數(shù)、概率、平均數(shù)、類符/形符對數(shù)比以及更為復(fù)雜的因子分析、多元分析、聚類分析等數(shù)理統(tǒng)計功能的評估,深刻地探討語料庫的通過定量方式對知識的處理水平。對馬克思主義中國化話語語料庫的知識共享能力進行評估,對語料庫的知識推廣能力、知識產(chǎn)權(quán)保護、知識應(yīng)用能力等進行評估,探討語料庫在消除知識壁壘、推動知識的自由流動、降低知識的獲取成本、推動知識共享方面的積極作用,有助于提高語料庫的知識服務(wù)整體效率。對馬克思主義中國化話語語料庫的知識創(chuàng)新能力進行評估,在對語料庫的知識獲取能力、知識處理能力、知識共享能力進行評估的基礎(chǔ)上,對語料庫在追求新發(fā)現(xiàn)、創(chuàng)立新學(xué)說、創(chuàng)造新方法、積累新知識、探索新規(guī)律等方面做出評估,深入地發(fā)掘語料庫對科學(xué)知識發(fā)現(xiàn)新路徑的重大意義。