計算機輔助翻譯的學(xué)習(xí)不能局限于某一個計算機輔助翻譯軟件的操作,而應(yīng)傾向于“知識側(cè)重論”,傾向于理解該軟件設(shè)計的脈絡(luò)和原理,對軟件設(shè)計背后的基本概念和基本原則的理解,是計算機輔助翻譯學(xué)習(xí)的基本要求。
《計算機輔助翻譯基礎(chǔ)》分為基礎(chǔ)知識、翻譯與信息科學(xué)、文檔格式處理的自動化、術(shù)語管理與翻譯、翻譯記憶庫、翻譯記憶庫等章節(jié),旨在能讓讀者提供高效的、高質(zhì)量的翻譯服務(wù)。
《論語·衛(wèi)靈公》中有云:“工欲善其事,必先利其器”。這句話為人們所熟知,其道理也很簡單:要想把事情做好,工具必須好使,如此才能事半功倍。計算機輔助翻譯的出現(xiàn)、發(fā)展和流行,與“工欲善其事,必先利其器”的思想是一脈相承的。計算機輔助翻譯學(xué)習(xí)和研究的主要目標,就是借助信息技術(shù)來優(yōu)化人工翻譯過程,以提供更好、更快的翻譯服務(wù)。無論是翻譯專業(yè)(或語言專業(yè))的學(xué)生,還是翻譯工作者,提供高效、優(yōu)質(zhì)的翻譯服務(wù)是他們的共同愿望,當(dāng)然也深知“工欲善其事,必先利其器”的道理。由是,經(jīng)過業(yè)界諸多專家、學(xué)者近十年的倡導(dǎo)和推廣,熟悉計算機輔助翻譯技術(shù)的人員越來越多,計算機輔助翻譯技術(shù)應(yīng)用領(lǐng)域也越來越廣,這是一個可喜的現(xiàn)象。
然而也應(yīng)該看到,計算機輔助翻譯技術(shù)的推廣面臨越來越大的阻力。這種阻力來自于兩個方面。首要的方面是機器翻譯的高速發(fā)展;谏疃葘W(xué)習(xí)的機器翻譯技術(shù)在過去幾年里發(fā)展迅猛。一些研究表明,在一些特定的領(lǐng)域(如新聞)中,機器翻譯的譯文水平已經(jīng)達到甚至超過了人工翻譯。由此而產(chǎn)生的疑問是:如果機器已經(jīng)可以完成翻譯任務(wù),翻譯過程不再需要人的參與,自然也就不再需要計算機輔助的人工翻譯,那么還有必要學(xué)習(xí)計算機輔助翻譯工具嗎?
另一方面的阻力是計算機輔助翻譯學(xué)習(xí)的難度。雖然計算機輔助翻譯已經(jīng)為越來越多的人所知曉,然而其仍然是一個陌生且令人望而卻步的領(lǐng)域,如山上云霧中的亭臺樓閣,依稀可見,卻難以看得清楚,難以真正了解。導(dǎo)致這一現(xiàn)象的原因有很多。其中主要的原因是這一領(lǐng)域的學(xué)習(xí)內(nèi)容、學(xué)習(xí)方法與語言學(xué)習(xí)的課程大相徑庭。語言學(xué)習(xí)課程包括各種語言技能訓(xùn)練課程、文化知識課程、語言文學(xué)理論課程等,強調(diào)記憶、聯(lián)想、宏觀理論推導(dǎo)和思辨。然而,計算機輔助翻譯是信息技術(shù)和工具的運用,側(cè)重翻譯過程中問題的解決。這些問題,如標點符號的準確使用、格式的標準化、術(shù)語翻譯的一致性、翻譯記憶庫的制作等,大多具體、瑣碎、相互關(guān)聯(lián)。因此,語言課程中的各種學(xué)習(xí)方法難以有效遷移到計算機輔助翻譯的學(xué)習(xí)之中。另一個重要原因是,對于大多數(shù)語言專業(yè)的學(xué)生而言,計算機的運作如同黑匣子一般。計算機輔助翻譯涉及各種信息技術(shù)專業(yè)知識,如文字編碼、文件格式與轉(zhuǎn)換、數(shù)據(jù)庫操作、軟件界面交互,甚至算法等,計算機操作中嚴謹?shù)倪壿嬐评、煩瑣的操作步驟以及復(fù)雜的參數(shù)設(shè)置都令人無所適從。
如上所述,一方面,技術(shù)的發(fā)展使得計算機輔助翻譯技術(shù)的學(xué)習(xí)看起來似乎已經(jīng)不再需要;另一方面.計算機輔助翻譯技術(shù)難以掌握。那么,為什么還需要學(xué)習(xí)計算機輔助翻譯技術(shù)呢?我們認為,上述對計算機輔助翻譯技術(shù)及其應(yīng)用的理解是不全面的。當(dāng)前基于深度學(xué)習(xí)的機器翻譯技術(shù),如同其他基于深度學(xué)習(xí)的人工智能技術(shù)一樣,必須滿足豐富數(shù)據(jù)和知識、完全信息、確定性信息、靜態(tài)、單領(lǐng)域和單任務(wù)的要求。機器翻譯的成功依賴于超大規(guī)模的平行語料庫數(shù)據(jù),其性能也受到單一領(lǐng)域的局限,難以跨領(lǐng)域移植。更為重要的是,語言作為人類的交際工具,具有明顯的創(chuàng)造性、動態(tài)性和不確定性特征。這些特征都是當(dāng)前基于深度學(xué)習(xí)的人工智能技術(shù)無法解決的。從這個角度看,機器翻譯的應(yīng)用必然受到數(shù)據(jù)規(guī)模、語言動態(tài)性和創(chuàng)造性的局限。高級別的人工翻譯具有其不可替代性。翻譯行業(yè)仍然需要依賴于人工翻譯提供服務(wù),機器翻譯也需要依賴于人工翻譯提供數(shù)據(jù)。
此外,計算機輔助翻譯技術(shù)與機器翻譯技術(shù)兩者并非兩種“井水不犯河水”的技術(shù)。相反,許多計算機輔助翻譯技術(shù)都是以機器翻譯技術(shù)為基礎(chǔ),兩者在本質(zhì)上都是自然語言處理技術(shù)的應(yīng)用。如同機器翻譯一樣,計算機輔助翻譯的最主要應(yīng)用,就是拓展翻譯工作者的信息處理能力,提高翻譯服務(wù)的質(zhì)量和效率。譯后編輯模式的發(fā)展,就是結(jié)合計算機輔助翻譯技術(shù)與機器翻譯技術(shù),應(yīng)對不同場景需求,提升翻譯效率和質(zhì)量的例證。
因此,我們認為,在人工智能快速發(fā)展的時代,計算機輔助翻譯技術(shù)的學(xué)習(xí)不是沒有必要了,反而是變得更為重要、更為緊迫了。機器翻譯技術(shù)的進步對翻譯工作人員提出了更高的要求。面對機器翻譯的挑戰(zhàn),翻譯工作者應(yīng)積極了解機器翻譯和自然語言處理技術(shù),積極將相關(guān)技術(shù)應(yīng)用于翻譯實踐,運用相關(guān)技術(shù)拓展自身的信息處理能力,如此才有可能立于不敗之地。
唐旭日,博士,華中科技大學(xué)外語學(xué)院翻譯系主任,副教授。研究方向為計算語言學(xué),涉及命名實體識別、隱喻計算、詞義演化計算、構(gòu)式聚類、語義韻、計算機輔助翻譯等。主持國家社科基金研究項目一項,教育部自主創(chuàng)新項目一項,校級自主創(chuàng)新及湖北省教育廳社科項目多項,并作為主要成員參與國家863高新技術(shù)、國家自然科學(xué)基金以及國家社科基金等多項重量課題,在World Wide Web、International Journal of Corpus Linguistics、Natural Language Engineering、 Corpus Linguistics and Linguistic Theory、《武漢大學(xué)學(xué)報(信息科學(xué)版)》、《中文信息學(xué)報》、《當(dāng)代語言學(xué)》、COLING等非常不錯刊物和學(xué)術(shù)會議上發(fā)表論文20多篇,出版教材一部。
第一章 基礎(chǔ)知識
1.1 字符編碼
1.1.1 ASCII編碼
1.1.2 漢字編碼
1.1.3 Unicode編碼
1.1.4 UTF-8編碼
1.2 自然語言處理技術(shù)
1.2.1 語言及其定義
1.2.2 自然語言處理技術(shù)
第二章 翻譯與信息科學(xué)
2.1 傳統(tǒng)翻譯過程及其局限性
2.1.1 微觀層面的局限性
2.1.2 宏觀層面的局限性
2.2 信息技術(shù)與翻譯
2.2.1 信息技術(shù)與翻譯主體
2.2.2 信息技術(shù)與翻譯過程
2.2.3 信息技術(shù)與翻譯效率提升
2.3 歷史與未來
2.3.1 計算機輔助翻譯的歷史
2.3.2 計算機輔助翻譯的未來
2.4 計算機輔助翻譯研究框架
第三章 文檔格式處理的自動化
3.1 文檔格式與翻譯
3.2 文檔格式自動化的原理
3.2.1 可譯字串與不可譯字串
3.2.2 文件格式的自動化
3.3 SDL Trados Studio與版面格式自動化
3.3.1 軟件格式支持類型
3.3.2 翻譯單個文檔
3.3.3 可譯字串抽取
3.3.4 不可譯字串的顯示與處理
3.3.5 源語言替換
第四章 術(shù)語管理與翻譯
4.1 術(shù)語的確認
4.1.1 術(shù)語的定義
4.1.2 術(shù)語的表現(xiàn)形式
4.2 自動術(shù)語抽取
4.2.1 候選術(shù)語生成
4.2.2 術(shù)語識別原理
4.2.3 術(shù)語抽取實驗
4.3 術(shù)語數(shù)據(jù)庫的構(gòu)建
4.3.1 術(shù)語知識微觀描述框架
4.3.2 術(shù)語庫的構(gòu)建
4.3.3 術(shù)語更新
4.4 術(shù)語數(shù)據(jù)庫的使用
4.5 術(shù)語管理策略
第五章 翻譯記憶庫
5.1 什么是翻譯記憶庫
5.2 翻譯記憶庫的應(yīng)用模式
5.2.1 SDL Trados Studio中的預(yù)翻譯模式
5.2.2 SDL Trados Studio中的句段模式
5.2.3 匹配率計算
5.3 翻譯記憶庫的構(gòu)建
5.3.1 語料對齊算法
5.3.2 語料對齊工具及其使用
5.3.3 語段邊界劃分與翻譯單位
5.4 翻譯記憶庫的組織與維護
5.5 翻譯記憶庫應(yīng)用的優(yōu)勢與劣勢
5.5.1 翻譯效率方面的優(yōu)勢與劣勢
5.5.2 翻譯質(zhì)量上的優(yōu)勢與劣勢
第六章 翻譯質(zhì)量保證
6.1 翻譯質(zhì)量保證
6.2 翻譯質(zhì)量檢測及其工具
6.2.1 翻譯質(zhì)量檢測的原則
6.2.2 翻譯質(zhì)量檢測工具
6.2.3 SDL Trados Studio 2015的翻譯質(zhì)量驗證工具
6.3 翻譯質(zhì)量管理體系
6.3.1 《翻譯服務(wù)譯文質(zhì)量要求》
6.3.2 《翻譯質(zhì)量量度》
6.3.3 《翻譯質(zhì)量保證標準指南》
6.3.4 《歐洲質(zhì)量標準:EN一15038》與ISO17100
6.3.5 動態(tài)質(zhì)量框架
第七章 翻譯記憶庫
7.1 本地化與翻譯
7.2 軟件交互界面翻譯
7.3 Passolo與交互界面翻譯
7.4 軟件交互界面翻譯原則
7.4.1 一般性原則
7.4.2 術(shù)語翻譯規(guī)范
7.4.3 格式規(guī)范
7.4.4 不翻譯內(nèi)容
7.4.5 地名
第八章 譯后編輯
8.1 定義、歷史與前景
8.2 神經(jīng)機器翻譯
8.3 自動譯后編輯
8.3.1 理據(jù)
8.3.2 自動譯后編輯技術(shù)
8.4 翻譯質(zhì)量評估與翻譯質(zhì)量預(yù)測
8.4.1 翻譯質(zhì)量評估
8.4.2 翻譯質(zhì)量預(yù)測
8.5 人工譯后編輯
8.5.1 譯后編輯工作量指標
8.5.2 MT錯誤分類及其對譯后編輯工作量的影響
8.6 譯后編輯行為模式
第九章 正則表達式
9.1 什么是正則表達式
9.2 正則表達式的使用
9.3 正則表達式的結(jié)構(gòu)與功能
9.3.1 與行的起始、結(jié)束相關(guān)的模塊單元
9.3.2 字符類型組相關(guān)單元
9.3.3 搭配相關(guān)模塊單元
9.3.4 詞語的多種形式與譯文的一致性
9.3.5 詞語的重復(fù)
9.3.6 翻譯贅余
9.3.7 字符的轉(zhuǎn)義
9.3.8 正則表達式注意事項
9.4 常用正則表達式對應(yīng)表
附錄Ⅰ SDL Trados Studio 2015支持的文件類型
附錄Ⅱ 質(zhì)量檢測工具調(diào)查
參考文獻