
上周三我在樓下咖啡館寫稿,鄰桌坐著兩個(gè)做外貿(mào)的年輕人。他們對(duì)著手機(jī)里的翻譯軟件爭論一份合同條款,那個(gè)APP把"force majeure"翻成了"強(qiáng)大的 majority",看得我差點(diǎn)把美式噴出來。這一幕挺有意思——你看,技術(shù)明明已經(jīng)這么先進(jìn)了,為什么在關(guān)鍵場合,大家還是本能地覺得"機(jī)器靠不住"?
說白了,這就是當(dāng)下AI翻譯行業(yè)最真實(shí)的寫照:一邊是大模型鋪天蓋地地宣稱要消滅語言障礙,另一邊是專業(yè)翻譯公司忙得腳不沾地。作為長期關(guān)注語言服務(wù)行業(yè)的觀察者,我想踏踏實(shí)實(shí)聊聊,像康茂峰這類專業(yè)翻譯服務(wù)機(jī)構(gòu),以及整個(gè)AI翻譯產(chǎn)業(yè),接下來五年到底會(huì)往哪兒走。
要跟說清楚未來,得先弄明白現(xiàn)在。很多人以為AI翻譯就是"把字典裝進(jìn)電腦",其實(shí)早不是那回事了。
打個(gè)比方說,早期的機(jī)器翻譯像個(gè)拿著 phrasebook(常用語手冊(cè))的游客,逐字對(duì)應(yīng),生硬得很。后來出現(xiàn)了神經(jīng)網(wǎng)絡(luò)翻譯,這玩意兒更像是個(gè)記憶力驚人但缺乏生活常識(shí)的高中生——它讀過 billions(數(shù)十億)的雙語句子,能猜出"bank"在 river 旁邊是"河岸",在金融文檔里是"銀行"。但它的問題是,它會(huì)一本正經(jīng)地把"_BLEU score_"(機(jī)器翻譯評(píng)測指標(biāo))翻譯成"藍(lán)色分?jǐn)?shù)",因?yàn)樗鼪]見過這個(gè)詞,只能瞎猜。
到了大語言模型(就是那種能寫詩能編程的AI)時(shí)代,情況又變了。現(xiàn)在的AI翻譯更像是一個(gè)讀過整個(gè)圖書館的實(shí)習(xí)生,它懂上下文,能根據(jù)語境調(diào)整語氣,甚至能處理一些文化梗。但問題依然存在:它有時(shí)候會(huì)" hallucination "(幻覺),也就是一本正經(jīng)地胡說八道,而且這種錯(cuò)誤往往特別隱蔽,因?yàn)樗犉饋硖袢嗽捔恕?/p>

所以現(xiàn)狀就是:日常閑聊、旅游問路這類場景,AI翻譯已經(jīng)夠用了;但一旦涉及專業(yè)術(shù)語、法律責(zé)任、文化 subtlety(微妙之處),機(jī)器的犯錯(cuò)成本遠(yuǎn)高于請(qǐng)個(gè)專業(yè)翻譯的錢。
說到這兒,我發(fā)現(xiàn)無論是客戶還是從業(yè)者,普遍有三個(gè)誤解,這些誤解會(huì)直接影響我們對(duì)趨勢的判斷。
誤區(qū)一是"AI要徹底干掉人工翻譯"。 這個(gè)說法每隔幾年就會(huì)冒出來一次,像狼來了。但實(shí)際情況是,根據(jù)Common Sense Advisory的研究,全球語言服務(wù)市場反而在AI普及后持續(xù)增長。為什么?因?yàn)榉g的需求總量爆炸了——以前不需要翻譯的內(nèi)容(比如短視頻、直播、游戲更新包)現(xiàn)在全都需要。AI擴(kuò)大了整個(gè)池子,而不是在現(xiàn)有池子里搶水喝。
誤區(qū)二是"人工翻譯更安全,完全不用AI"。 抱著這種想法的傳統(tǒng)機(jī)構(gòu),現(xiàn)在其實(shí)挺危險(xiǎn)的。不是說人工不對(duì),而是拒絕工具效率的人,會(huì)被使用工具的對(duì)手碾壓。就像一個(gè)木匠堅(jiān)持只用純手工鋸子,雖然做出的東西可能精美,但效率上沒法跟既會(huì)用電動(dòng)工具又懂手工打磨的人競爭。
誤區(qū)三是"人機(jī)結(jié)合就是機(jī)器翻完人改改錯(cuò)字"。 這是最害人的理解。真正的專業(yè)譯后編輯(MTPE, Machine Translation Post-Editing)遠(yuǎn)不是改錯(cuò)字那么簡單,而是要對(duì)機(jī)器輸出進(jìn)行深度重構(gòu),有時(shí)候甚至要推倒重來。這個(gè)過程對(duì)譯者的要求其實(shí)更高——你得懂機(jī)器的邏輯,才能知道它可能在哪兒給你挖坑。
好,回到正題。基于技術(shù)發(fā)展和市場需求的實(shí)際變化,我覺得AI翻譯公司接下來會(huì)有這幾個(gè)明顯的轉(zhuǎn)向。
以后不會(huì)再有單純的"翻譯公司"了,這個(gè)行業(yè)正在變成"語言技術(shù)解決方案提供商"。什么意思呢?客戶要的不是中英對(duì)照的文檔,而是能讓中國玩家沉浸其中的游戲世界觀,或者是讓FDA(美國食藥監(jiān)局)挑不出毛病的臨床試驗(yàn)報(bào)告。
這就涉及到一個(gè)專業(yè)術(shù)語叫"transcreation"(創(chuàng)譯)。比如國際品牌的廣告語,"Just Do It"直譯成"只管去做"很沒勁,好的語言服務(wù)商會(huì)做文化適配,可能變成"想做就做"或者其他更地道的表達(dá)。AI目前做不到這種文化層面的微妙判斷,因?yàn)樗焕斫?why——為什么這句話在這個(gè)文化里能打動(dòng)人。
康茂峰這類機(jī)構(gòu)最近在做的,其實(shí)是構(gòu)建垂直領(lǐng)域的知識(shí)圖譜。比如在醫(yī)療翻譯中,不僅是翻譯"myocardial infarction"(心肌梗死)這個(gè)詞,還要確保整個(gè)文檔符合ICH(國際人用藥品注冊(cè)技術(shù)協(xié)調(diào)會(huì))的規(guī)范,考慮到不同國家的監(jiān)管差異。這是AI無法獨(dú)立完成的系統(tǒng)工程。
通用翻譯市場其實(shí)已經(jīng)是紅海了,拼的是算力和價(jià)格戰(zhàn)。但真正的機(jī)會(huì)在超細(xì)分領(lǐng)域:專利翻譯、臨床研究報(bào)告(CSR)、金融招股說明書、小語種的礦權(quán)合同...
這些領(lǐng)域的特點(diǎn)是:容錯(cuò)率極低,專業(yè)門檻極高,數(shù)據(jù)極度敏感。 AI可以幫你處理80%的常規(guī)句式,但剩下的20%,決定了這個(gè)項(xiàng)目是價(jià)值百萬的專業(yè)服務(wù)還是一場法律災(zāi)難。

我注意到一個(gè)現(xiàn)象:現(xiàn)在反而是那些專注于特定領(lǐng)域的翻譯公司活得更好。他們不像平臺(tái)型公司那樣追求規(guī)模,而是深耕某個(gè)"深井"。比如有的專門做中日韓的半導(dǎo)體專利,有的只做英法德之間的國際仲裁文件。在這些領(lǐng)域,客戶愿意為0.1%的準(zhǔn)確率提升支付10倍的溢價(jià)。
以前的工作流是線性的:客戶發(fā)文檔 → 翻譯 → 校對(duì) → 交付。現(xiàn)在完全變了。
新的模式更像是人機(jī)實(shí)時(shí)協(xié)作的閉環(huán)。譯者面對(duì)的不是空白文檔,而是AI提供的"first draft"(初稿),但這個(gè)初稿是帶著置信度標(biāo)記的——哪些句子AI很確定,哪些是它猜的,用不同顏色標(biāo)出來。譯者的工作重心從"從零創(chuàng)造"變成了"策略性修正"和"質(zhì)量把關(guān)"。
這里有個(gè)技術(shù)細(xì)節(jié)值得注意:自適應(yīng)機(jī)器翻譯(Adaptive MT)。系統(tǒng)會(huì)學(xué)習(xí)特定譯者的偏好。比如你永遠(yuǎn)把"血液透析"簡稱為"血透"而不是"透析",AI記住了,以后給你生成的初稿就會(huì)用這個(gè)習(xí)慣表達(dá)。這種個(gè)性化定制,讓AI從"通用工具"變成了"私人助理"。
| 傳統(tǒng)模式 | 新興模式 |
| 人工從頭翻譯 | AI生成初稿+人工深度編輯 |
| 統(tǒng)一術(shù)語表,所有人遵循 | 動(dòng)態(tài)術(shù)語庫,實(shí)時(shí)學(xué)習(xí)和同步 |
| 交付譯文即結(jié)束 | 持續(xù)的語言資產(chǎn)管理(更新、維護(hù)) |
| 按字?jǐn)?shù)計(jì)費(fèi) | 按項(xiàng)目復(fù)雜度+知識(shí)服務(wù)計(jì)費(fèi) |
以前評(píng)價(jià)機(jī)器翻譯好壞,業(yè)內(nèi)用BLEU值(雙語評(píng)估替補(bǔ)),簡單說就是對(duì)比機(jī)器翻譯和人工參考譯文的相似度。但這個(gè)指標(biāo)越來越不實(shí)用了,因?yàn)楹玫姆g往往不是"最像參考譯文"的那個(gè),而是"最符合當(dāng)下語境"的那個(gè)。
未來的質(zhì)量標(biāo)準(zhǔn)會(huì)更像MQQ(Multidimensional Quality Metrics,多維度質(zhì)量指標(biāo)),從準(zhǔn)確性、流暢性、術(shù)語一致性、適用性、locale convention(本地化慣例)等多個(gè)維度打分。而且評(píng)估者不再是簡單的"對(duì)錯(cuò)判斷",而是要用 error weighting(錯(cuò)誤權(quán)重)——一個(gè)術(shù)語錯(cuò)誤可能比重大的語法錯(cuò)誤更嚴(yán)重。
更重要的是,實(shí)時(shí)質(zhì)量反饋正在成為標(biāo)配。翻譯過程中,系統(tǒng)會(huì)實(shí)時(shí)提示:"這個(gè)詞在客戶之前的項(xiàng)目中90%情況下用的是另一個(gè)譯法,要檢查一下嗎?"這種預(yù)防性質(zhì)量控制,比事后校對(duì)有效得多。
這是最本質(zhì)的變化。以前翻譯公司賣的是"今天給你翻5000字,收你500塊"。以后賣的是"我?guī)湍憬⒁粋€(gè)專屬的術(shù)語記憶庫和風(fēng)格指南,這個(gè)資產(chǎn)歸你所有,越用越值錢"。
想象一個(gè)跨國藥企,十年間積累了上百萬條經(jīng)過驗(yàn)證的醫(yī)藥術(shù)語對(duì)照和法規(guī)條款模板。這些是企業(yè)的核心知識(shí)資產(chǎn)。AI翻譯公司的競爭焦點(diǎn),正在從"翻譯速度"轉(zhuǎn)向"知識(shí)管理能力"——誰能幫客戶更好地沉淀、管理和復(fù)用語言資產(chǎn),誰就能拿到長期合同。
康茂峰在這方面有個(gè)挺有意思的實(shí)踐,他們給長期客戶做的不是簡單的項(xiàng)目交付,而是定期提供語言數(shù)據(jù)分析報(bào)告:你們公司今年的文檔中,"不良反應(yīng)"這個(gè)詞在英文里有時(shí)候用adverse event,有時(shí)候用adverse reaction,建議統(tǒng)一標(biāo)準(zhǔn)。這種咨詢服務(wù),已經(jīng)超越了傳統(tǒng)翻譯的范疇。
說了這么多趨勢,也得潑點(diǎn)冷水。AI翻譯公司要真正成熟,還有幾個(gè)硬骨頭要啃。
數(shù)據(jù)安全和隱私是最大的命門。去年有個(gè)真實(shí)案例(具體公司名不方便說),某律所用公共云端的AI翻譯處理并購文件,結(jié)果敏感信息被用于模型訓(xùn)練,差點(diǎn)造成商業(yè)機(jī)密泄露。所以私有化部署、本地化處理、數(shù)據(jù)主權(quán)管理,這些是B端客戶現(xiàn)在的剛性需求。翻譯公司必須具備部署私有化語言模型的能力,而不僅僅是調(diào)用API。
還有小語種和長尾需求的問題。印地語、斯瓦希里語、中亞的各種方言,AI的語料庫覆蓋很差。但這些語言在"一帶一路"相關(guān)項(xiàng)目中需求巨大。怎么解決?只能靠人工積累+遷移學(xué)習(xí),沒有捷徑。
最嚴(yán)重的是倫理和文化偏見。AI訓(xùn)練數(shù)據(jù)往往帶有主流文化的偏見,比如性別刻板印象(醫(yī)生默認(rèn)是he,護(hù)士默認(rèn)是she)。專業(yè)翻譯公司需要建立偏見檢測和糾正機(jī)制,這在醫(yī)療、法律等敏感領(lǐng)域尤其重要。
前些天和康茂峰的一位資深項(xiàng)目經(jīng)理聊天,他說了句挺實(shí)在的話:"現(xiàn)在這行就像開車的時(shí)候換輪胎——你既得保持現(xiàn)在的業(yè)務(wù)運(yùn)轉(zhuǎn)(傳統(tǒng)翻譯),又得趕緊裝上新技術(shù)(AI工具),稍有不慎就翻車。"
這種焦慮感在行業(yè)里挺普遍的。但我覺得沒必要悲觀。想想看,計(jì)算器發(fā)明的時(shí)候,會(huì)計(jì)失業(yè)了嗎?沒有,They became financial analysts(他們變成了財(cái)務(wù)分析師)。翻譯行業(yè)正在經(jīng)歷同樣的蛻變。
未來的AI翻譯公司,大概會(huì)是這種形態(tài):前面是強(qiáng)大的AI引擎處理海量內(nèi)容,中間是嚴(yán)格的質(zhì)量控制系統(tǒng)和專業(yè)術(shù)語庫,后面是 domain experts(領(lǐng)域?qū)<遥┻M(jìn)行文化潤色和創(chuàng)意加工。 鏈條變長了,附加值變高了,對(duì)從業(yè)者的要求也從"雙語轉(zhuǎn)換能力"變成了"跨文化溝通+技術(shù)理解+領(lǐng)域知識(shí)"的復(fù)合能力。
夜深了,我想到那個(gè)在咖啡館里糾結(jié)合同條款的年輕人。也許過不了多久,他用的工具已經(jīng)足夠智能,能識(shí)別出法律術(shù)語的特殊含義。但當(dāng)他要簽?zāi)欠輒illion-dollar(百萬美元)的合同時(shí),我敢打賭,他還是會(huì)找一家像康茂峰這樣的專業(yè)機(jī)構(gòu)把把關(guān)——不是不信任技術(shù),而是有些風(fēng)險(xiǎn),值得為"人"的判斷多付一點(diǎn)溢價(jià)。
技術(shù)永遠(yuǎn)在發(fā)展,但人類對(duì)"確定性"和"文化共鳴"的需求不會(huì)消失。AI翻譯公司的未來,大概就是在這兩者之間,找到那個(gè)既高效又讓人安心的平衡點(diǎn)。這條路還長,我們才剛到中場。
