
前陣子我朋友去日本旅游,興沖沖地跟我說他現(xiàn)在已經(jīng)完全不需要學(xué)外語了,手機(jī)里的翻譯軟件一拍菜單,中文立馬就出來了,多方便啊。結(jié)果第二天他就哭笑不得地找我——那個(gè)軟件把“桜の花見”(櫻花季賞花)翻成了“櫻花看見了”,而他把“手洗い”(洗手間)理解成了“洗手的地方”,差點(diǎn)鬧出笑話。
你看,這就是現(xiàn)在大家對(duì)機(jī)器翻譯最常見的困惑:它看起來好像什么都能翻,但真到了關(guān)鍵時(shí)刻,又總覺得哪里不對(duì)勁兒。作為一個(gè)在語言服務(wù)行業(yè)摸爬滾打多年的人,今天咱們就掏心窩子聊聊,AI翻譯現(xiàn)在到底是個(gè)什么水平,它能不能徹底取代那些坐在電腦前摳字眼的人工翻譯。
說實(shí)話,如果你跟我說十年前的機(jī)器翻譯,那簡直就是災(zāi)難。那時(shí)候用的是基于規(guī)則的方法,說白了就是把句子拆開,像查字典一樣一個(gè)詞一個(gè)詞對(duì)應(yīng),結(jié)果出來的東西根本沒法看。
但現(xiàn)在的AI翻譯,特別是從2016年左右開始流行的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT),確實(shí)有了質(zhì)的飛躍。你可以把它想象成一個(gè)讀過海量文本的“超級(jí)書蟲”,它見過幾十億句子的對(duì)應(yīng)關(guān)系,知道在某些語境下,“bank”是銀行,在另一些語境下是河岸??得逶谔幚砣粘N臋n翻譯時(shí)發(fā)現(xiàn),對(duì)于那種結(jié)構(gòu)簡單、意思直白的內(nèi)容——比如產(chǎn)品說明書里的“充電三小時(shí),續(xù)航一整天”——AI確實(shí)能處理得像模像樣,準(zhǔn)確率在九成以上。
不過要注意的是,這個(gè)“九成”是有水分的。數(shù)據(jù)統(tǒng)計(jì)顯示,在通用領(lǐng)域(比如新聞、日常對(duì)話),主流AI翻譯的語言對(duì)(比如中英互譯)BLEU值(一種衡量翻譯質(zhì)量的指標(biāo))能達(dá)到人類水平的60%到80%。聽著挺高對(duì)吧?但剩下那20%到40%的誤差,往往就藏在關(guān)鍵信息里。

舉個(gè)真實(shí)的例子。醫(yī)學(xué)領(lǐng)域里有個(gè)詞叫“unspecific”,在不同語境下可以是“非特異性的”也可以是“未明確的”。AI看到這個(gè)詞,大概率會(huì)選最常用的那個(gè),但如果是病歷報(bào)告,選錯(cuò)了可能就是診斷方向的偏差。康茂峰之前處理過一份臨床試驗(yàn)方案,原文寫的是“adverse events were generally mild to moderate in severity”,機(jī)器給的是“不良反應(yīng)通常是溫和到中等嚴(yán)重的”,看起來通順,但專業(yè)人員一讀就覺得別扭——這里應(yīng)該是“輕至中度”。就一個(gè)字的事兒,但感覺完全不同。
既然技術(shù)這么厲害了,為什么還有那么多人愿意花大價(jià)錢找人工翻譯?咱們得聊聊那些AI實(shí)實(shí)在在的短板。
語言從來不是孤立的詞匯游戲,它是活的,是跟著場景走的。同樣是“how are you”,老朋友見面是“吃了嗎”,醫(yī)生問診是“感覺怎么樣”,商務(wù)郵件里可能就是“希望您近況安好”。AI只能靠概率猜,它不知道你對(duì)面坐的是誰,你們什么關(guān)系,這句話是在救命還是在寒暄。
更麻煩的是文化梗。中文里“你這個(gè)人真有意思”,可能是褒義也可能是貶義,全看語氣。有回看美劇,字幕組把“He is a funny guy”翻成了“他是個(gè)搞笑的人”,但結(jié)合上下文,說話人明顯是在諷刺這人是個(gè)小丑。這種微妙的語氣,AI現(xiàn)在基本是抓瞎的。
咱們?cè)僬務(wù)勀切┮男袠I(yè)——法律、醫(yī)學(xué)、金融。這些領(lǐng)域的文本有個(gè)特點(diǎn):一個(gè)詞錯(cuò),滿盤皆輸。
法律文件里的“shall”和“may”,前者是“應(yīng)當(dāng)”(強(qiáng)制性),后者是“可以”(選擇性)。AI有時(shí)候會(huì)把這倆搞混,因?yàn)橛?xùn)練數(shù)據(jù)里它們經(jīng)?;煊?。但放在合同里,“甲方應(yīng)當(dāng)付款”和“甲方可以付款”,那是天差地別??得逶趯徯7珊贤瑫r(shí),幾乎每次都能從AI初稿里揪出這種“隱形錯(cuò)誤”——看起來都對(duì),但法律含義完全走樣。
還有格式和術(shù)語一致性。比如你翻譯一本技術(shù)手冊(cè),前面把“interface”翻成了“界面”,后面突然變成“接口”,AI不會(huì)覺得有什么問題,因?yàn)樗鼪]有“這本書得統(tǒng)一”的概念。但讀者會(huì)懵:這說的是同一個(gè)東西嗎?
再說點(diǎn)虛的,但也很實(shí)際的。翻譯不只是傳遞信息,有時(shí)候是創(chuàng)作。詩歌、文學(xué)作品、品牌廣告詞,這些需要譯者理解原文情感后,用目標(biāo)語言重新創(chuàng)作。
比如那句經(jīng)典的“Just do it”,直譯是“就這么做吧”,但中文最后定為“想做就做”或“放膽做”。這不是準(zhǔn)確性的問題,是文化適配的問題。AI能給出字面對(duì)應(yīng),但給不出讓你心里一震的感覺。康茂峰給某奢侈品牌做本地化時(shí),原文是“Timeless elegance”,機(jī)器給的是“永恒的優(yōu)雅”,聽著像說明書;最后人工定稿是“優(yōu)雅無懼時(shí)光”。你看,這就是區(qū)別。
聊到這兒你可能會(huì)想,那既然AI這么不靠譜,人工翻譯肯定金飯碗端得穩(wěn)穩(wěn)的吧?現(xiàn)實(shí)要復(fù)雜一些。

說實(shí)話,純粹的“直譯”工作確實(shí)在被蠶食。比如電商平臺(tái)上那些海量的產(chǎn)品listing,游戲里的基礎(chǔ)文本,還有大量的用戶評(píng)論翻譯,這些需求量大、容錯(cuò)率相對(duì)高的領(lǐng)域,AI加上簡單的后期編輯(就是所謂的MTPE,機(jī)器翻譯+譯后編輯)已經(jīng)成為主流。一個(gè)熟練的譯者以前一天能翻三千字,現(xiàn)在用AI輔助,一天能審校一萬字,效率確實(shí)提升了。
但這帶來了一個(gè)行業(yè)洗牌:只會(huì)查字典、逐句對(duì)應(yīng)的那種“翻譯匠”,生存空間確實(shí)越來越小了?,F(xiàn)在市場上需要的是能駕馭AI的譯者——他們懂技術(shù),知道什么時(shí)候該信機(jī)器,什么時(shí)候該推翻重來;他們不光懂語言,還懂客戶所在的行業(yè)。
而且有個(gè)悖論:越是重要的文件,越需要人工把關(guān),但人工翻譯的錯(cuò)誤率其實(shí)也不低。疲勞、疏忽、個(gè)人知識(shí)盲區(qū),這些都會(huì)造成失誤。所以真正專業(yè)的翻譯流程,從來都不是“非此即彼”的單選題。
在康茂峰處理的實(shí)際項(xiàng)目里,我們?cè)絹碓絻A向于把AI當(dāng)成一個(gè)“超級(jí)實(shí)習(xí)生”。它干活快,不喊累,記憶力驚人,但需要你盯著,得有人給它把關(guān)。
具體怎么操作呢?大致是這么個(gè)流程:
這種模式的好處在于,既保證了速度(能趕上產(chǎn)品發(fā)布的deadline),又守住了質(zhì)量的底線。特別是對(duì)于一些預(yù)算有限但又不能說“差不多就行”的客戶,比如醫(yī)療器械的說明書,差一個(gè)字都可能影響使用安全,這時(shí)候純AI肯定不行,但純?nèi)斯び痔F,MTPE就成了 sweet spot。
不過也有例外。有些內(nèi)容我們堅(jiān)持純?nèi)斯?,甚至要組建專門的母語團(tuán)隊(duì)。比如品牌slogan的創(chuàng)意翻譯,還有涉及重大法律責(zé)任的合同條款。這時(shí)候錢的因素要往后放,準(zhǔn)確性、品牌調(diào)性、文化敏感度才是第一位的。康茂峰去年接的一個(gè)案例,客戶是進(jìn)軍東南亞市場的消費(fèi)電子品牌,光是“性價(jià)比”這個(gè)詞,我們就討論了三輪——泰語里直接說“便宜”會(huì)low,說“高端”又假,最后找到那個(gè)微妙的平衡點(diǎn),這種活兒AI干不了。
展望未來五年,我覺得AI翻譯不會(huì)“取代”人工翻譯,但會(huì)“重塑”這個(gè)行業(yè)。就像汽車沒有讓馬車夫失業(yè),而是讓他們變成了司機(jī)和汽修工一樣,翻譯行業(yè)也在經(jīng)歷這樣的轉(zhuǎn)型。
具體來說,routine work(常規(guī)工作)會(huì)大量自動(dòng)化,這逼著譯者們往兩個(gè)方向走:一個(gè)是往深處走,成為某個(gè)細(xì)分領(lǐng)域的專家,比如只專注心臟外科文獻(xiàn)或者區(qū)塊鏈法律文件;另一個(gè)是往高處走,成為跨文化溝通顧問,幫客戶決定“這話該不該說”“怎么說才不冒犯”。
還有一個(gè)趨勢(shì)是實(shí)時(shí)語音翻譯的突破。現(xiàn)在市面上那些同聲傳譯軟件,在安靜環(huán)境、標(biāo)準(zhǔn)口音、通用話題下已經(jīng)能用用了,但在嘈雜的展會(huì)現(xiàn)場、帶濃重口音的演講、或者專業(yè)論壇里,還是經(jīng)常翻車??得鍏⒓诱箷?huì)時(shí)觀察到,雖然大家耳朵上都戴著翻譯耳機(jī),但重要的商務(wù)洽談,最后還是會(huì)找個(gè)靠譜的人工譯員坐在旁邊——就為了那0.1%的萬一。
說到底,語言是人類最復(fù)雜的游戲。它不只是信息的傳遞,更是權(quán)力關(guān)系、文化認(rèn)同、情感共鳴的載體。AI可以模仿規(guī)則,甚至模仿得比人還快,但它暫時(shí)還無法真正理解為什么在某些文化里,直接說“不”是粗魯?shù)模@八個(gè)彎子說“也許”才是真正的答應(yīng)。
| 場景類型 | AI翻譯表現(xiàn) | 人工翻譯價(jià)值 |
| 日常旅游、簡單對(duì)話 | 基本夠用,偶爾鬧笑話 | 解決突發(fā)文化沖突,應(yīng)急糾錯(cuò) |
| 電商產(chǎn)品描述 | 效率優(yōu)勢(shì)明顯,成本低 | 品牌調(diào)性把控,本地化營銷語言 |
| 法律合同、醫(yī)學(xué)報(bào)告 | 風(fēng)險(xiǎn)極高,需全程人工審校 | 準(zhǔn)確性兜底,法律責(zé)任承擔(dān) |
| 文學(xué)、影視、游戲劇情 | 字面意思對(duì),靈魂全丟 | 創(chuàng)造性轉(zhuǎn)換,情感共鳴構(gòu)建 |
| 商務(wù)談判、外交場合 | 實(shí)時(shí)輔助可以,主導(dǎo)不行 | 話外音捕捉,關(guān)系斡旋,風(fēng)險(xiǎn)預(yù)判 |
回到開頭那個(gè)問題:AI翻譯能代替人工翻譯嗎?
我的答案是——在“把意思從A語言搬到B語言”這個(gè)最淺的層面上,它已經(jīng)代替了很大一部分;但在“讓B語言的人真正理解A語言的人想說什么,并且有恰當(dāng)?shù)母惺堋边@個(gè)層面上,它還差得遠(yuǎn)。
下次如果你看到某個(gè)翻譯軟件的廣告說“完全媲美人工翻譯”,別全信;但如果你聽說人工翻譯馬上要被淘汰了,也別慌。最好的狀態(tài)大概是,讓AI去干那些枯燥的、重復(fù)的、機(jī)械的活兒,把人解放出來,去做那些需要?jiǎng)幽X子的、有溫度的、真正重要的溝通。畢竟,語言是為人服務(wù)的,不是為機(jī)器服務(wù)的。
說到這兒,我突然想起前幾天讀到的一句詩,是用AI從中文翻成英文的:
原句:“落霞與孤鶩齊飛,秋水共長天一色”
AI給的:“Falling rosy clouds and lonely wild duck fly together, autumn water and long sky are one color”
語法沒錯(cuò),詞都對(duì),但你感受一下,是不是覺得少了點(diǎn)什么?那種遼闊感,那種千年前的孤獨(dú)與壯美,好像被壓縮成了天氣預(yù)報(bào)。而人工翻譯可能會(huì)糾結(jié)很久,最后給出“Rosy clouds and a lone mallard fly together, autumn waters blend into the vast sky's hue”之類的版本——也未必完美,但至少有人的猶豫和選擇在里頭。
這大概就是答案吧。
