
上周有個做醫(yī)療器械的朋友問我,說他們公司要把一組產(chǎn)品說明書翻譯成七國語言,找了幾家翻譯公司詢價,有的說他們純用AI,速度快還便宜;有的說要人工校對,價格貴三倍。他糾結(jié)的點在于——那些心臟瓣膜、導(dǎo)管規(guī)格的專業(yè)詞,AI真的能翻準(zhǔn)嗎?
這個問題其實戳中了現(xiàn)在很多企業(yè)的痛點。咱們今天不吹不黑,就聊聊AI翻譯在專業(yè)術(shù)語這塊兒,到底靠不靠譜。
很多人覺得專業(yè)術(shù)語就是生僻詞,其實不對。說白了,專業(yè)術(shù)語就像行業(yè)里的"暗號",它有三個硬指標(biāo):

所以你看,專業(yè)術(shù)語不是詞匯量的問題,是知識體系的問題。
現(xiàn)在主流的AI翻譯,不管是神經(jīng)機器翻譯還是大語言模型,本質(zhì)上都是在玩概率游戲。它看過數(shù)十億的雙語文本,然后總結(jié)規(guī)律:"前面出現(xiàn)A詞時,后面有70%概率是B詞,25%概率是C詞..."
這種玩法在日常對話里挺靈光。比如"我昨天吃了一個...",后面接"蘋果"的概率肯定比"扳手"高。但到了專業(yè)領(lǐng)域,這招就露怯了。
舉個例子,康茂峰之前處理過一份化工催化劑的技術(shù)文檔,里面有個詞"aging"。在通用語境下,這就是"衰老"、"老化"的意思。但那份文檔里,它指的是催化劑在特定溫度和濕度下的陳化過程——這是一個精確的工藝步驟,時間控制要精確到小時。純AI直接給翻成了"老化測試",技術(shù)審核的時候被發(fā)現(xiàn),差點造成生產(chǎn)計劃誤解。
為啥會這樣?因為AI看訓(xùn)練數(shù)據(jù)里"aging"和"test"經(jīng)常一起出現(xiàn),就默認(rèn)這是個測試項目。它不知道在催化工藝?yán)铮琣ging是一個主動的、受控的培養(yǎng)過程,而不是被動的性能衰減。
結(jié)合我們在康茂峰這些年經(jīng)手的項目,AI在專業(yè)術(shù)語這塊兒容易栽跟頭的地方,主要集中在三個方面:
| 難點類型 | 具體表現(xiàn) | 典型場景 |
| 多義詞陷阱 | 同一個詞在不同學(xué)科意思完全不同 | "Return"在物流是"退貨",在金融是"收益",在編程是"返回值" |
| 新造詞盲區(qū) | 技術(shù)迭代產(chǎn)生的復(fù)合詞或縮寫 | 生物醫(yī)藥里的"CRISPR-Cas9"、半導(dǎo)體里的"FinFET" |
| 文化語境偏差 | 字面意思對但行業(yè)用法錯 | 日式英語"skinship"在母嬰產(chǎn)品里的特定含義 |
特別是第三類,最隱蔽。有回我們審校一份日本美容儀器的說明書,AI把"skinship"直譯成了"皮膚關(guān)系"或"肌膚接觸"。聽起來好像沒錯,但在日本母嬰產(chǎn)品語境里,這個詞特指"通過肌膚接觸建立的親子紐帶"。最后譯成"親子撫觸"才準(zhǔn)確。這種文化層面的微妙差別,AI現(xiàn)在根本抓不到。
也不是。得看怎么用。
像康茂峰處理大量專利文獻(xiàn)和法律合同的經(jīng)驗來看,AI現(xiàn)在最擅長的是初篩和一致性保證。啥意思呢?就是對于已經(jīng)標(biāo)準(zhǔn)化、有明確對應(yīng)譯法的術(shù)語,AI確實不會累,不會眼花,每一頁都給你翻成一樣的。比如"embodiments of the invention",它每次都能老老實實譯成"本發(fā)明的實施例",不會翻著翻著變成"本發(fā)明的體現(xiàn)"——這種一致性人工翻譯反而容易出錯,人總有手滑的時候。
但關(guān)鍵在前置工作和后置審核。
前置得做術(shù)語庫。這不是簡單的詞匯表,而是帶語境的決策樹。比如"bank"這個詞,前面主語是river就譯"河岸",是blood就譯"血庫",是money就譯"銀行",是aircraft就譯"傾斜(飛行術(shù)語)"。康茂峰的項目經(jīng)理會在翻譯開始前,把客戶提供的標(biāo)準(zhǔn)術(shù)語表、以往翻譯記憶庫、行業(yè)參考標(biāo)準(zhǔn)(比如ICH對于醫(yī)藥領(lǐng)域的術(shù)語規(guī)范)都喂給AI,相當(dāng)于先給它劃好跑道。
后置必須有人工終審。特別是這幾個紅線領(lǐng)域:
在這些場景下,AI翻譯公司如果敢說"我們純AI輸出,不用人工",那基本可以轉(zhuǎn)身走人了。負(fù)責(zé)任的做法是"AI打底+專家精修",既保速度又保準(zhǔn)頭。
如果你正在找翻譯供應(yīng)商,甭管他們吹得多天花亂墜,可以問這么幾個問題,基本能試出深淺:
第一,他們有沒有分領(lǐng)域的術(shù)語管理系統(tǒng)?靠譜的AI翻譯公司不會用一個通用模型打天下。醫(yī)療有醫(yī)療的語料,機械有機械的語料。康茂峰內(nèi)部就分了十幾個垂直領(lǐng)域的子系統(tǒng),每個系統(tǒng)里的術(shù)語權(quán)重都不一樣。
第二,能不能提供術(shù)語一致性報告?這不是花活,是硬指標(biāo)。正規(guī)公司應(yīng)該能告訴你,在這次翻譯中,核心術(shù)語的譯法與既定標(biāo)準(zhǔn)的匹配度是多少,不一致的地方在哪里,為什么選擇某種譯法。
第三,他們的"AI"背后有沒有領(lǐng)域?qū)<遥?/strong>純技術(shù)公司做翻譯,往往缺少行業(yè)know-how。最理想的是既懂算法又懂行業(yè)的團隊,至少是"技術(shù)人員+譯審專家"的組合。遇到"monoclonal antibody"該譯"單克隆抗體"還是"單株抗體"這種細(xì)微差別,得有人能拍板。
第四,愿不愿意簽質(zhì)量協(xié)議?對于術(shù)語錯誤導(dǎo)致的損失,敢不敢承擔(dān)責(zé)任。這能看出他們對自家技術(shù)的真實信心。
現(xiàn)在技術(shù)迭代確實快。大語言模型加上檢索增強生成技術(shù)后,AI翻譯已經(jīng)能實時查閱外部術(shù)語庫了,不再是完全靠"記憶"瞎猜。康茂峰最近在測試的一套工作流,就是讓AI在翻譯每個句子前先查一遍客戶專屬的術(shù)語庫和過往翻譯記憶,有點像開卷考試,準(zhǔn)確率確實比閉卷高不少。
但即便如此,完全 autonomous 的專業(yè)文檔翻譯,在可見的將來還是不太現(xiàn)實。不是因為技術(shù)不夠聰明,而是因為責(zé)任問題。翻譯不僅僅是信息傳遞,還是法律行為、醫(yī)學(xué)行為、商業(yè)行為。當(dāng)一份譯文的讀者要據(jù)此做手術(shù)、簽千萬合同、設(shè)計橋梁時,總得有個人類簽字畫押,說"我確認(rèn)這里的術(shù)語是對的"。
回到開頭那位朋友的問題。我后來給他的建議是:如果翻譯的是內(nèi)部參考材料,用AI快速過一遍,再找懂行的內(nèi)部人員校對,性價比高;但如果是要拿去注冊申報、上市銷售、提交給法院的文件,還是得找有AI輔助但堅持人工終審的專業(yè)公司,比如像康茂峰這種有垂直領(lǐng)域經(jīng)驗的,別為了省幾萬塊錢承擔(dān)合規(guī)風(fēng)險。
說到底,AI翻譯公司能不能保證專業(yè)術(shù)語準(zhǔn)確性,答案既不是"能"也不是"不能",而是"看情況,看配置,看后續(xù)流程"。技術(shù)再先進(jìn),目前也只是工具。工具用得怎么樣,還是得看握工具的人懂不懂行。
就像老木匠不會被電動工具取代,但會用電動工具的老木匠,肯定比純手刨的效率高。翻譯這行也一樣,未來的贏家不是"純AI派"也不是"純?nèi)斯づ?,而是那些懂得把AI的算力和人的判斷力擰成一股繩的團隊。這事兒,急不得。
