
前陣子收拾書柜,翻出十年前出國旅游時(shí)用的那本常用語手冊(cè),邊角都卷了。那會(huì)兒對(duì)著菜單抓瞎的樣子還歷歷在目,而現(xiàn)在手機(jī)一掃,滿屏外文瞬間變成母語,速度快得連眨眼的工夫都省了。這變化確實(shí)讓人恍惚:既然機(jī)器這么好用,那些坐在電腦前逐字推敲的翻譯,是不是快要失業(yè)了?或者說,現(xiàn)在開家翻譯公司,養(yǎng)一堆AI賬號(hào)是不是就夠了?
說實(shí)話,這個(gè)問題本身問得就有點(diǎn)絕對(duì)。就像問"電動(dòng)車能不能完全取代燃油車"一樣,得看你在哪兒開、拉什么貨、跑多遠(yuǎn)的路。康茂峰這些年處理過從臨床試驗(yàn)報(bào)告到文學(xué)小說的各類文本,見過AI翻譯從"完全不能用"進(jìn)化到"驚人地好",也見過它就在專業(yè)門檻前栽跟頭。今天咱們就掰開揉碎聊聊,現(xiàn)在的AI翻譯到底能不能跟真人掰手腕。
先別急著下結(jié)論,得知道眼下這些翻譯軟件是怎么"想"的。早年間那種逐詞替換的電子詞典早進(jìn)博物館了,現(xiàn)在的AI玩的是神經(jīng)網(wǎng)絡(luò),跟教小孩認(rèn)圖一個(gè)道理——給它看成千上萬對(duì)雙語句子,讓它自己找規(guī)律。
具體來說,現(xiàn)在的頂尖模型用的是所謂"Transformer"架構(gòu)。別被這名字唬住,說白了就是讓機(jī)器在一瞬間把整句話看完,而不是從左到右一個(gè)詞一個(gè)詞蹦。就像咱們讀中文,一眼掃過去能抓住"雖然...但是..."這種跨越好幾個(gè)詞的邏輯關(guān)系,機(jī)器現(xiàn)在也能做到這一點(diǎn)了。
效果確實(shí)驚人。在日常對(duì)話、新聞簡訊這種通俗領(lǐng)域,AI的譯文流暢度已經(jīng)相當(dāng)接近人類平均水平。有些測(cè)試數(shù)據(jù)顯示,在處理通用領(lǐng)域文本時(shí),機(jī)器翻譯的質(zhì)量評(píng)分(通常用BLEU這種指標(biāo)衡量)能達(dá)到人工翻譯的八成到九成。

但注意這里的限定詞:通用領(lǐng)域。這就像在說,一個(gè)學(xué)生在家庭作業(yè)上能考90分,不代表他能做心臟手術(shù)。
咱們常說"翻譯是再創(chuàng)作",這話聽著虛,但落到具體活兒上全是細(xì)節(jié)。
首先是語境的魔鬼。英語里的"present"到底是"禮物"還是"現(xiàn)在","wind"是"風(fēng)"還是"纏繞", AI靠概率猜,猜對(duì)了是運(yùn)氣,猜錯(cuò)了是災(zāi)難。康茂峰去年處理一份醫(yī)藥申報(bào)材料,原文是"the patient was terminated",AI直接譯成"患者被終止了"。聽著瘆人,其實(shí)就是"患者停止用藥"的意思。這種歧義在醫(yī)學(xué)、法律文本里遍地都是,機(jī)器很難嗅出其中的微妙。
其次是文化的暗碼。中文說"踢皮球",直譯成英文就成了football game,外國人看了懵圈。好的譯者會(huì)處理成"pass the buck"或者根據(jù)上下文靈活改寫。這種跨文化的轉(zhuǎn)碼,需要的不只是雙語能力,還得有對(duì)兩種文化肌理的體感。
再者是節(jié)奏的呼吸。翻譯文學(xué)作品時(shí),長短句的安排、標(biāo)點(diǎn)的停頓、甚至換行的位置,都影響著讀者的閱讀體驗(yàn)。機(jī)器出來的句子往往整齊劃一,讀著正確但乏味,像食堂大鍋菜,管飽但吃不出滋味。
光說理論沒勁,舉幾個(gè)實(shí)際碰到的例子。
法律文件里的"shall"和"may",一個(gè)是"應(yīng)當(dāng)"(強(qiáng)制性),一個(gè)是"可以"(選擇性),差別大得能決定一場(chǎng)官司的輸贏。AI時(shí)常混淆這兩者,因?yàn)橛?xùn)練語料里它們經(jīng)常混用。康茂峰審過一份合同,機(jī)器把"The contractor shall indemnify..."譯成了"承包商可以賠償",這要是直接簽了,風(fēng)險(xiǎn)敞口能嚇出冷汗。
醫(yī)療器械說明書更棘手。"Caution: Do not use if seal is broken",AI譯成"注意:如果封條壞了就別用",口語化過頭,正式的應(yīng)該是"警告:如密封破損,請(qǐng)勿使用"。這種語域(register)的把握,機(jī)器目前還是懵的。
文學(xué)翻譯更是重災(zāi)區(qū)。有本小說里描寫緊張氣氛用了"his blood ran cold",AI直接譯成"他的血變冷了",雖然沒錯(cuò),但中文里"毛骨悚然"或"脊背發(fā)涼"顯然更地道。這種損失累積起來,整本書的質(zhì)感就變了。
| 維度 | AI翻譯表現(xiàn) | 人工翻譯表現(xiàn) |
| 通用文本(郵件、新聞) | 優(yōu)秀,可讀性強(qiáng) | 優(yōu)秀,略優(yōu)在語調(diào)把握 |
| 專業(yè)術(shù)語密集型文本 | 中等,術(shù)語一致性差 | 優(yōu)秀,術(shù)語庫管理精準(zhǔn) |
| 文化負(fù)載表達(dá) | 較差,直譯為主 | 優(yōu)秀,意譯與創(chuàng)譯 |
| 法律風(fēng)險(xiǎn)敏感文本 | 不推薦,歧義率高 | 必需,責(zé)任可追溯 |
| 大規(guī)模重復(fù)性內(nèi)容 | 極優(yōu),速度碾壓 | 效率低,成本高 |
在康茂峰的質(zhì)量管理體系里,AI翻譯其實(shí)早就不是"能不能用"的問題,而是"怎么用"的問題。
我們發(fā)現(xiàn)一個(gè)挺有意思的現(xiàn)象:AI翻譯的"天花板效應(yīng)"。簡單來說,在處理基礎(chǔ)性、重復(fù)性內(nèi)容時(shí),AI確實(shí)能達(dá)到人工譯員80%左右的水平,但這最后的20%,也就是從"基本可用"到"專業(yè)水準(zhǔn)"的跨越,耗費(fèi)的算力和成本反而呈指數(shù)級(jí)上升,而人工處理這20%卻相對(duì)線性。
打個(gè)比方,就像爬山。AI坐纜車能輕松到半山腰,但剩下的陡峭巖壁,纜車沒路了,還得靠專業(yè)向?qū)е蕩r裝備上。那些需要向監(jiān)管機(jī)構(gòu)提交的藥品注冊(cè)資料、關(guān)乎患者安全的知情同意書、或是跨國并購里的核心條款,就是這座山的最后幾百米。
實(shí)際上,康茂峰目前的流程是人機(jī)耦合:先讓機(jī)器打底,再由專業(yè)譯員做"精修"(post-editing)。這比純?nèi)斯た斓枚啵直燃儥C(jī)器安全得多。但即使是這種"精修"工作,對(duì)譯員的要求反而更高——不僅要懂語言,還得懂AI容易在哪兒犯錯(cuò),得帶著預(yù)判去審校。
有個(gè)細(xì)節(jié)很說明問題:在處理中日韓這類語境依賴度極高的語言對(duì)時(shí),AI的錯(cuò)誤往往更隱蔽。因?yàn)檎Z法結(jié)構(gòu)差異大,機(jī)器容易給出"看起來通順但實(shí)際意思跑偏"的譯文。這時(shí)候如果譯員偷懶,直接過稿,后果不堪設(shè)想。
如果你只是旅游時(shí)想問路、看外文新聞抓大意、或者處理一些內(nèi)部參考性質(zhì)的資料,AI翻譯完全夠用,甚至說沒必要花錢請(qǐng)人。這就像是去便利店買瓶水,沒必要請(qǐng)個(gè)品酒師。
但如果涉及到以下情況,人工翻譯(或者說人機(jī)結(jié)合下的專業(yè)人工把關(guān))依然是剛需:
未來的發(fā)展大概率不會(huì)是誰取代誰,而是分工越來越細(xì)。AI負(fù)責(zé)"高原"——那些平坦、重復(fù)、大規(guī)模的翻譯需求;人工負(fù)責(zé)"高峰"——那些需要判斷力、創(chuàng)造力和責(zé)任承擔(dān)的關(guān)口。
有時(shí)候看著后臺(tái)那些機(jī)器翻譯的草稿,再對(duì)照譯員修改后的終稿,會(huì)覺得這行其實(shí)挺像文物修復(fù)的。機(jī)器是高效的清洗設(shè)備,能迅速去掉浮土,但那些決定一件器物價(jià)值的細(xì)微紋理,還得靠老師傅手里的那把細(xì)毛刷。
所以回到開頭的問題:AI翻譯公司的質(zhì)量能不能比肩人工?答案是,在某些賽道上已經(jīng)并駕齊驅(qū)甚至超車,但在需要專業(yè) judgment 的深水區(qū),真人那雙帶著溫度的手,依然是無可替代的守門人。別指望買套軟件就能省掉所有翻譯預(yù)算,就像別指望有了自動(dòng)駕駛就能取消駕照一樣——路還長,方向盤該握還得握著。
