- 行業(yè)新聞
-
基于受控語言的譯前編輯對機器翻譯的影響
發(fā)布時間:2017-09-19 14:42 點擊:
機器翻譯在語言服務行業(yè)發(fā)揮著越來越重要的作用,如何提高機器翻譯的準確度是急需解決的問題。除機器翻譯技術本身的改進之外,人工參與是提高機器翻譯質(zhì)量的重要途徑,這也是典型的人機交互翻譯。針對機器翻譯的交互而言,主要可分為兩種:譯前編輯與譯后編輯。譯前編輯是指在機器翻譯之前對需要翻譯的文本或文檔進行有針對性的修改編輯以提高機器翻譯產(chǎn)出的質(zhì)量,譯后編輯則是指對機器翻譯的原始產(chǎn)出進行修改編輯的過程,目的也是為了通過人機結合提高機器翻譯的最終質(zhì)量。有效的譯前編輯可以在很大程度上減少譯后編輯者的工作量,所以業(yè)界有時也把譯前編輯視為(廣義)譯后編輯的有機組成部分。一般而言,譯前編輯與機器翻譯的充分譯后編輯密切相關,兩者都是為了有效地傳播信息,需要保證較高或可出版(publishable)的翻譯質(zhì)量。然而,如何進行譯前編輯,什么樣的文本適合進行譯前編輯?有沒有一定的規(guī)則可供遵循?是否可以運用受控語言(controlled language)的寫作規(guī)則對文檔進行譯前編輯,基于受控語言的譯前編輯對機器翻譯質(zhì)量的影響到底如何?基于實驗與實例,本文嘗試對這些問題進行解答,以探索受控語言在機器翻譯的譯前編輯方面的應用潛力。
如果原語文檔使用受控語言寫作,機器翻譯的準確度便會大幅提高,尤其適用于多語發(fā)布的文檔。胡清平曾指出,“翻譯軟件的研發(fā)和受控語言的推廣是改進機器翻譯質(zhì)量的兩個方向”,受控語言加機器翻譯便是受控翻譯(controlled translation),并提出了受控漢英翻譯的設想與十點建議,對基于受控語言的譯前編輯不無啟示。當然,譯前編輯并不能解決所有問題,因為很多機器翻譯的錯誤是很難預知的,如果要達到較高的質(zhì)量,還需要對機器翻譯的產(chǎn)出進行譯后編輯,劉毅就認為“無論機器多智能,也無論譯者花了多長時間做譯前編輯工作,未成功翻譯的文本還是占有一定比例,我們不能完全依賴機器翻譯,還需進行機器翻譯后的編輯”。所以本文也會適當?shù)赜懻撟g后編輯,探討如何通過基于受控語言的譯前編輯以及對編輯過原文的機譯產(chǎn)出進行譯后編輯,以產(chǎn)生更高質(zhì)量的譯文。翻譯自動化用戶協(xié)會(TAUS)提供的譯后編輯線上課程包括六個實踐模塊,其中之一便是譯前編輯,這也一定程度上說明了譯前編輯與譯后編輯密不可分的關系。目前機器翻譯主要應用于以下三個方面:(1)產(chǎn)生粗略的翻譯,不需對原文或譯文進行任何編輯,可稱之為概要式或瀏覽式翻譯;(2)對機器翻譯的原始產(chǎn)出進行譯后編輯以提高譯文的質(zhì)量(也包括譯前編輯);(3)在某具體領域使用受控語言以生成較高質(zhì)量的譯文。通過初步實驗,筆者認為,也完全可以把受控語言的寫作原則應用到機器翻譯的譯前編輯之中,基于受控語言的譯前編輯可以有效降低原文本身的復雜性與歧義性,提高機器翻譯的可識別度(原文本身的可翻譯性),從而減少(充分)譯后編輯的工作量。
基于受控語言的譯前編輯
目前已經(jīng)有一百多種受控語言,廣泛運用在大公司的技術文檔寫作中。通過采用語法和詞匯的限制,受控語言提供更為清楚與直接的寫作,減少詞匯句法方面的歧義,提高了文檔的可讀性和可譯性,使其更適合進行機器翻譯,在大公司的科技文本系統(tǒng)中被廣泛使用。受控語言采用受控詞匯和受控語法,其中單詞量和每個單詞的意義都被嚴格控制以避免詞法的歧義性,應用于機器翻譯系統(tǒng)時是非常有利的。受控語法旨在強化清晰的風格,避免省略結構以及多重復合句的出現(xiàn),把句法歧義(如介詞短語結構、形容詞修飾、回指短語等)降到最低程度。Mitamura 等和Nyberg 等提出了實施受控翻譯的有利條件:翻譯目的是為了傳播信息,作者經(jīng)過高水平訓練,受控語言需經(jīng)過檢測者(軟件)檢驗,應用領域為技術領域或特定領域。值得說明的是,受控翻譯主要指文本寫作時就使用受控語言以提高文本本身可理解性與可翻譯性(針對機器翻譯而言),基于受控語言的譯前編輯主要是針對未使用受控語言的文本而言的。
機器翻譯的譯前編輯也可基于受控語言的寫作規(guī)則進行規(guī)范,或者說對科技文本進行譯前編輯也是受控翻譯環(huán)境的組成部分。譯者需要調(diào)整不同行業(yè)的文本使其適應受控語言寫作指南,用來實現(xiàn)原語寫作的連貫性以及提高這些文本的可譯性。當描述語法和詞性限制時,寫作指南可在相關文獻中輕易找到。Mitamura 等解釋道,KANT機譯系統(tǒng)所用的受控英語的詞匯限制包括以下幾個方面:盡量使用限定詞等功能性詞語;避免使用代詞和連詞,因為其容易增加句子歧義;在連詞后面或簡化關系從句中應該限制或減少使用分詞形式(包括現(xiàn)在分詞與過去分詞),因此上述兩個例子應改為:While you are driving the vehicle...和The directional stability that is caused by the wheel lock-up...。Mitamura 等(同上)還指出短語和句子限制的不同,在短語限制層面,要用單個動詞替代動詞短語(turn on應改為start),重復聯(lián)合結構中的介詞以避免歧義,如短語recorded memory of radio and each control unit是歧義的,因為它可以被解釋為{recorded memory of radio} and {each control unit} 或 recorded memory {of radio and each control unit}。在句子限制層面,Mitamura 等(同上)指出有關并列句式(兩部分應該處于同種形式),關系從句(應該由關系代詞引入)以及省略結構(應盡量避免出現(xiàn))的規(guī)則。Wojcik(1998)提供了波音所使用的受控語言的寫作規(guī)則,指出:(1)諸如the,a,an,this和these這樣的限定詞應當合理使用;(2)在描述性寫作中應該避免使用被動語態(tài);(3)句子長度應該限定在25個單詞以內(nèi);(4)應該避免超過三個單詞的名詞群;(5)不應該有超過兩個形容詞修飾一個名詞或一個名詞群;(6)現(xiàn)在分詞的形式應該盡量避免;(7)動詞后面的關聯(lián)詞that不能省略;(8)關系從句必須由關系代詞引入;(9)并列結構中鼓勵出現(xiàn)平行結構。這些受控語言的寫作原則對機器翻譯的譯前編輯(英漢方向)基本上同樣適用。
關于機器翻譯的譯前編輯,國內(nèi)也略有探討,個別學者也提出了受控語言在譯前編輯中的作用。魏長宏探討了幾種譯前編輯的方法,包括格式轉(zhuǎn)換、拼寫檢查、句子調(diào)整、建立翻譯記憶庫、使用受控語言以及選擇體裁和專業(yè)領域。魏長宏(同上)指出,受控語言是對原語的無限集進行一定的限制,這種限制分為自然限制和人為限制,自然限制指把研究對象局限于某一特殊領域內(nèi)的子語言,人為限制指機器翻譯系統(tǒng)附加上一個受控語言寫作環(huán)境,讓寫作環(huán)境來提示作者寫出滿足機器翻譯系統(tǒng)要求的句子,從而限制句型與句子的復雜度,保證系統(tǒng)處理的正確率。在魏長宏的研究中,采取受控語言只是譯前編輯非常小的一部分,此部分的探討遠非充分與深入。吳慧穎以英國諾里奇市城堡博物館荷蘭畫作的簡介為例,研究了譯前編輯與譯后編輯分別使用機器翻譯的對比。吳慧穎(同上)認為譯前編輯所花費的時間和精力相對于譯后編輯來說更長、更多,但其翻譯效果并沒有優(yōu)于譯后編輯。然而,這種觀點有待商榷,針對可出版的機譯質(zhì)量而言,譯前編輯與譯后編輯更多的是一個整體,合理的譯前編輯可以節(jié)省譯后編輯的工作量,兩者結合會比單純的譯后編輯節(jié)約精力�?傊�,“受控語言不僅可以提高技術文獻的可讀性和標準化程度,而且可以提高技術文獻的可譯性,是一種改進機器翻譯質(zhì)量比較有效的方法”。如果原文沒有用受控語言寫作的話,基于受控語言的譯前編輯無疑也是提高機器翻譯質(zhì)量的有效途徑。
案例研究
1.實驗設計
機器翻譯比較適合技術文檔的翻譯,技術翻譯與技術寫作共同構成了技術傳播,受控語言在技術傳播領域大有用武之地。本文以技術傳播領域用戶手冊的翻譯為例來探討基于受控語言的譯前編輯對機器翻譯的影響,選擇蘋果公司iPhone5系列的用戶手冊作為原文(英語)。用戶手冊比其他各種科技文本更簡潔易懂,方便對應用與不應用譯前編輯的機譯產(chǎn)出進行對比。此外,蘋果手機銷售到全球各地,用戶手冊的使用非常廣泛,勢必會被譯為多種語言,所以很容易找到蘋果手機用戶手冊的不同語言版本作為參考譯文。在中國,蘋果公司及其官方用戶手冊都具有高知名度和權威性;每個語言版本的用戶手冊都是由專家團隊設計,確保了準確性;英語原文和漢語標準譯文都很容易從網(wǎng)上獲取。所以筆者認為蘋果手機的用戶手冊是測試基于受控語言的譯前編輯對谷歌翻譯影響的上乘選擇之一。
首先,將原文輸入到谷歌翻譯引擎中,得到第一組譯文。然后,使用AST評估標準,參照標準譯文分析第一組譯文的質(zhì)量。接著,將經(jīng)過譯前編輯的英文原文輸入到谷歌翻譯中,得到第二組譯文,同樣依照AST評估標準與標準譯文,評價第二組譯文的質(zhì)量。最后,將兩組的評估得分進行對比,觀察第二組譯文質(zhì)量是否有所提高。筆者邀請五位專業(yè)譯員對于兩組譯文進行評估,并將對兩組譯文的得分進行回歸分析,以說明譯前編輯效果是否顯著。此外,為了生成更好的譯文,作者還對譯文進行了譯后編輯,以彌補譯前編輯的不足。由于本文案例工作量不大,筆者沒有采用機器自動評估方法。人工評估以其操作簡便評價準確的優(yōu)點更受青睞。在各種人工評估方法中,筆者選取了語言學數(shù)據(jù)聯(lián)盟首先提出的Adequacy Scale Task(充分性目標)標準。AST使用了許多不同的指標評價機器翻譯,其中常用的是從充分性(adequacy)和連貫性(fluency)兩方面打分。充分性指的是譯文傳達原文信息的量,連貫性或流暢性則不考慮句義傳達是否準確,注重的是翻譯的結構與格式,讀起來是否規(guī)范、流暢。
譯前編輯策略參考受控語言的寫作原則,主要從詞匯、詞組和句子三個層面進行限制,如Cardey 等就是采用這種分類。仿照受控語言寫作原則,結合漢英語言差異,通過反復調(diào)整和修改原文,觀察相對應譯文的改進,最終得出譯前編輯的技巧與方法。 世聯(lián)翻譯-讓世界自由溝通!專業(yè)的全球語言翻譯供應商,上海翻譯公司專業(yè)品牌。絲路沿線56種語言一站式翻譯與技術解決方案,專業(yè)英語翻譯、日語翻譯等文檔翻譯、同傳口譯、視頻翻譯、出國外派服務,加速您的全球交付。 世聯(lián)翻譯公司在北京、上海、深圳等國際交往城市設有翻譯基地,業(yè)務覆蓋全國城市。每天有近百萬字節(jié)的信息和貿(mào)易通過世聯(lián)走向全球!積累了大量政商用戶數(shù)據(jù),翻譯人才庫數(shù)據(jù),多語種語料庫大數(shù)據(jù)。世聯(lián)品牌和服務品質(zhì)已得到政務防務和國際組織、跨國公司和大中型企業(yè)等近萬用戶的認可。- 上一篇:翻譯質(zhì)量管理的有效條件
- 下一篇:語言服務的類型