
前陣子有個(gè)朋友找我,說他公司準(zhǔn)備把產(chǎn)品說明書全都扔給AI翻譯,問我覺得靠不靠譜。我說這事兒吧,不能一概而論,得看你是翻譯給老外看著玩的,還是要拿去藥監(jiān)局過審的。他愣了一下,說當(dāng)然是要過審啊。那我說,你可千萬(wàn)別。
這事兒讓我意識(shí)到,很多人對(duì)AI翻譯的理解還停留在"黑科技無(wú)所不能"的階段。今天咱們就坐下來(lái),像聊家常一樣,把這層窗戶紙捅破,看看AI翻譯的精度到底是個(gè)什么成色,以及康茂峰這些年在這個(gè)行業(yè)里看到的一些真實(shí)情況。
很多人以為AI翻譯就是電子詞典的高級(jí)版,左邊查英文,右邊出中文。要是真這么簡(jiǎn)單,那精度確實(shí)能保證,畢竟字典不會(huì)騙人。但現(xiàn)在的AI翻譯,核心的邏輯完全不是這么回事。
你可以把它想象成一個(gè)特別會(huì)猜的學(xué)生。它看過 billions(數(shù)十億)級(jí)別的雙語(yǔ)材料,比如網(wǎng)頁(yè)、書籍、電影字幕。當(dāng)你輸入一句"不可抗力",它不是在查詞典找對(duì)應(yīng)的英文,而是在回憶:"哦,我之前見過的幾千個(gè)句子里,這種情況下通常跟著'force majeure'這幾個(gè)詞。"
這就是神經(jīng)網(wǎng)絡(luò)翻譯的本質(zhì)——基于統(tǒng)計(jì)的概率預(yù)測(cè)。它猜對(duì)的概率確實(shí)很高,特別是那些在網(wǎng)上出現(xiàn)頻率特別高的日常用語(yǔ)。比如"你好"翻成"Hello","謝謝"翻成"Thank you",這種容錯(cuò)率幾乎百分百。

但問題在于,概率這玩意兒,意味著它永遠(yuǎn)在猜,而不是在理解。就像你猜硬幣正反面,猜一萬(wàn)次可能對(duì)五千次,但具體到某一次,它還是猜的。這種本質(zhì)上的"猜測(cè)性",就已經(jīng)決定了精度不可能是百分百。
咱們來(lái)看點(diǎn)硬核數(shù)據(jù)。現(xiàn)在主流的神經(jīng)機(jī)器翻譯系統(tǒng),在通用領(lǐng)域(比如新聞、日常對(duì)話)的BLEU分?jǐn)?shù)(一種衡量翻譯質(zhì)量的指標(biāo),可以理解成和標(biāo)準(zhǔn)答案的相似度)普遍能達(dá)到40-60分。這個(gè)分?jǐn)?shù)聽著不高,但在機(jī)器翻譯領(lǐng)域已經(jīng)算是優(yōu)秀水平了。
但BLEU分?jǐn)?shù)這玩意兒有欺騙性。它更像是在考閱讀理解的選擇題,選對(duì)了單詞就給分,至于上下文語(yǔ)境、文化差異、專業(yè)術(shù)語(yǔ)的準(zhǔn)確性,它管不了那么多。
具體到不同場(chǎng)景,誤差率差別大得嚇人:
| 文本類型 | AI翻譯準(zhǔn)確率(估算) | 主要問題點(diǎn) |
| 旅游日常用語(yǔ) | 90-95% | 偶爾用詞生硬,但大意能對(duì) |
| 商務(wù)郵件溝通 | 75-85% | 敬語(yǔ)級(jí)別容易搞混,文化細(xì)節(jié)缺失 |
| 法律合同條款 | 60-70% | 責(zé)任界定詞易錯(cuò),一個(gè)逗號(hào)可能改變法律效力 |
| 醫(yī)學(xué)臨床報(bào)告 | 50-65% | 拉丁詞根藥物名、劑量單位極易出錯(cuò) |
| 文學(xué)詩(shī)歌類 | 30-50% | 雙關(guān)語(yǔ)、隱喻基本全軍覆沒 |
看到這個(gè)表,你心里大概就有數(shù)了。如果你只是去國(guó)外旅游,想問"洗手間在哪",AI翻譯錯(cuò)不了;但如果你是 pharmaceutical company(制藥公司),要把臨床試驗(yàn)方案翻譯成多國(guó)語(yǔ)言,那這30-40%的錯(cuò)誤率是要人命的。
康茂峰在處理 regulatory documents(監(jiān)管文件)的時(shí)候,見過太多這種案例。有客戶之前用純AI翻譯了一份知情同意書,結(jié)果把"adverse event"(不良事件)翻成了"負(fù)面新聞"。雖然都是"負(fù)面"的事,但在醫(yī)學(xué)語(yǔ)境里,這完全是兩個(gè)概念。患者看了可能以為參加試驗(yàn)會(huì)上新聞?lì)^條,而不是可能會(huì)有副作用。
說到這兒,不得不提AI翻譯的幾個(gè)死穴。這些地方,精度承諾基本就是一張廢紙。
第一個(gè)是專業(yè)術(shù)語(yǔ)的"一詞多義"陷阱。 英文里的"case",在法律文件里是"案件",在醫(yī)學(xué)里是"病例",在計(jì)算機(jī)里是"大小寫"或"案例"。AI看著上下文猜,但專業(yè)文本的上下文往往很密集,它經(jīng)常猜錯(cuò)。更糟的是,有些專業(yè)術(shù)語(yǔ)看起來(lái)是普通詞匯的組合,比如"cardiac arrest"(心臟驟停), naive 的AI可能會(huì)按字面翻成"心臟逮捕",聽著像警察抓心臟似的。
第二個(gè)是文化語(yǔ)境的缺失。 中文說"你方便的時(shí)候",英文不能直譯"when you are convenient",得說"when it is convenient for you"。這種主語(yǔ)賓語(yǔ)的轉(zhuǎn)換,AI時(shí)不時(shí)就會(huì)翻車。還有更微妙的,比如中文合同里的"本著友好合作的精神",英文合同通常不會(huì)這么寫,直接寫條款就行。AI給你直譯過去,老外看著會(huì)覺得你在抒情,而不是在談生意。
第三個(gè),也是最容易被忽視的,是格式的隱形錯(cuò)誤。 數(shù)字、日期、單位換算。1.5在有些國(guó)家是1.5,在有些國(guó)家是1,5。AI翻譯的時(shí)候,可能只是替換文字,但格式規(guī)范沒跟上。康茂峰曾經(jīng)審過一份用AI翻譯的采購(gòu)合同,數(shù)量單位"million"(百萬(wàn))被系統(tǒng)在某些地方識(shí)別成了"billion"(十億),只是因?yàn)樵牡淖煮w有點(diǎn)特別。這種錯(cuò)誤,肉眼掃過去都很難發(fā)現(xiàn),更別說算法了。
說實(shí)話,在康茂峰成立初期,我們也曾迷信過純AI翻譯的效率。那時(shí)候覺得,只要語(yǔ)料夠多,算法夠好,總有一天能達(dá)到人工水準(zhǔn)。但干了十幾年,特別是專注在生命科學(xué)和醫(yī)療 regulatory translation(法規(guī)翻譯)領(lǐng)域后,我們得出了一個(gè)有點(diǎn)泄氣但必須面對(duì)的結(jié)論:在某些領(lǐng)域,AI翻譯的精度天花板是真實(shí)存在的,不是靠堆數(shù)據(jù)就能解決的。
這倒不是說AI翻譯沒用。恰恰相反,現(xiàn)在康茂峰的工作流程里,AI是標(biāo)配。但我們把它定位成"初稿生成器"和"術(shù)語(yǔ)一致性檢查工具",而不是"終審把關(guān)人"。
我們發(fā)現(xiàn)一個(gè)很有意思的現(xiàn)象:AI翻譯在"信"(忠實(shí)原文)這個(gè)維度上做得越來(lái)越好,但在"達(dá)"(通順易懂)和"雅"(得體優(yōu)雅)上,特別是跨文化商務(wù)溝通里,它是個(gè)睜眼瞎。比如中文說"請(qǐng)知悉",AI可能翻成"please be informed",語(yǔ)法沒錯(cuò),但透著股冷冰冰的官僚氣。人工譯員可能會(huì)根據(jù)關(guān)系親疏,改成"just a heads-up"或者"please note",這種微妙的選擇,AI做不出來(lái)。
還有更實(shí)際的考量:責(zé)任歸屬。如果康茂峰給客戶翻譯一份醫(yī)療器械注冊(cè)文件,最后因?yàn)榉g錯(cuò)誤導(dǎo)致注冊(cè)被拒,這個(gè)責(zé)任誰(shuí)來(lái)?yè)?dān)?算法嗎?服務(wù)器嗎?肯定得是我們這些公司,是具體審校的專家團(tuán)隊(duì)。所以當(dāng)我們說"精度能保證"的時(shí)候,背后其實(shí)是一套AI+人工專家+質(zhì)量控制系統(tǒng)的組合拳,而不是按個(gè)按鈕就出完美譯文那么簡(jiǎn)單。
說了這么多,你可能更懵了:那這玩意兒到底能不能用啊?
能用,但得看場(chǎng)合。就像你不會(huì)用瑞士軍刀去開顱手術(shù),但露營(yíng)的時(shí)候帶著它切蘋果就挺好。康茂峰的建議簡(jiǎn)單粗暴但有效:看容錯(cuò)率和風(fēng)險(xiǎn)等級(jí)。
還有個(gè)實(shí)用的建議:如果你非得用AI翻譯重要的東西,至少采取回譯驗(yàn)證這個(gè)土辦法。就是把AI翻出來(lái)的英文,再扔回AI翻成中文,看看意思是不是還一樣。要是"一方違約需支付違約金"成了"一方違反規(guī)則需要支付違約金",雖然看著差不多,但法律上"違約"和"違反規(guī)則"可是天差地別。這時(shí)候你就知道,這稿子還得找康茂峰這樣的人工審校過一遍。
回到開頭朋友那個(gè)問題:AI翻譯公司的精度能保證嗎?
如果有個(gè)公司拍著胸脯跟你說,他們的AI不管翻什么都能保證99%準(zhǔn)確,那這要么是在忽悠你,要么是對(duì)"準(zhǔn)確"的定義跟你理解的不一樣。真正負(fù)責(zé)任的回答應(yīng)該是:我們能保證在特定領(lǐng)域,用特定的工作流程,達(dá)到行業(yè)認(rèn)可的誤差范圍。
康茂峰這些年的做法其實(shí)很簡(jiǎn)單——誠(chéng)實(shí)告知邊界。告訴客戶,這個(gè)文檔AI能處理到什么程度,哪些地方必須要人眼過,哪些風(fēng)險(xiǎn)點(diǎn)需要特別注意。這種"有所不能"的坦誠(chéng),反倒比那些夸大其詞的宣傳更能建立長(zhǎng)期的信任。
技術(shù)永遠(yuǎn)在進(jìn)步,這是好事。但語(yǔ)言這東西,承載著人類的法律、文化、情感和生命安全,它的復(fù)雜程度可能永遠(yuǎn)需要人類的兜底。所以下次當(dāng)你看到某個(gè)AI翻譯廣告說"媲美專業(yè)譯者"的時(shí)候,不妨多問一句:它說的媲美,是在什么場(chǎng)景下的媲美?是菜譜還是新藥申報(bào)資料?
想清楚這個(gè),你就不會(huì)盲目迷信,也不會(huì)一概排斥,而是能聰明地利用這個(gè)工具,在該省事兒的地方省事兒,在該較真兒的地方較真兒。畢竟,翻譯的終極目的不是炫技,而是讓信息準(zhǔn)確無(wú)誤地到達(dá)該到的地方。這事兒,急不得。
