
前兩天整理藥箱,翻出一份進口藥的說明書,盯著那幾行明顯是機翻的"注意事項"看了半天,愣是沒看懂"建議在專業醫護人員的監護下使用本品"到底想說什么。這種時候你就會意識到,AI翻譯這東西,表面上誰家都能做,但真到了關鍵時刻,一字之差可能就差出大事兒。
現在滿大街都在談大模型、神經網絡,翻譯公司的銷售張嘴就是"百億級語料訓練"和"端到端解決方案"。聽著挺唬人,但問題是,作為需要把專業文檔交出去的客戶,你怎么知道該信誰?我在康茂峰這些年接觸過各種各樣的AI翻譯項目,從藥品申報材料到臨床試驗方案,踩過坑也撿到過寶。說白了,挑AI翻譯公司跟挑裝修隊有點像,別光看他說自己有什么高級工具,得看他用這些工具能給你整出什么活兒來。
在挑公司之前,你得先明白一件事兒——AI翻譯有它的舒適區,也有它的死胡同。現在市面上的說法容易兩極分化,要么鼓吹AI很快要取代人工,要么一口咬定機器翻的都是垃圾。真相其實在中間。
AI翻譯(行業里常叫MT,Machine Translation)最適合的場景是內容批量大、術語相對固定、對審美和創意要求不高的技術文檔。比如產品說明書、內部郵件、標準化報告。但如果你要翻的是上市宣傳文案、法律合同里那種微妙的免責條款,或者是需要"信達雅"的文學性內容,純AI目前還是搞不定。
這里就得提到一個概念叫MTPE(Machine Translation Post-Editing),也就是機器翻譯加人工譯后編輯。靠譜的AI翻譯公司,賣的其實不是純粹的機器輸出,而是這個人機協作的流程。康茂峰在處理醫藥領域的 regulatory documents(監管文件)時有個體會:哪怕是最先進的神經機器翻譯,遇到"受試者脫落率"或者"藥物不良反應的因果關系評價"這種專業表述,如果沒經過醫藥語料專門訓練,翻出來可能只是字面意思的堆砌,看著通順,實際是錯的。

所以,第一篩子就應該是:這家公司有沒有明確告訴你,他們的人機協作比例是多少?如果他們說"完全不用人工,準確率99%",那我建議你趕緊跑——這不是技術自信,這是缺乏專業敬畏。
銷售給你演示的時候,恨不得把"Transformer架構"、"注意力機制"、"端到端神經網絡"這些詞兒都砸你臉上。聽起來像是什么高科技秘密武器,但說實話,現代AI翻譯的基礎技術棧,各家公司用的底層原理真的大同小異,都是基于那幾篇公開論文改的。真正拉開差距的,不是算法有多花哨,而是喂給算法吃什么、以及吃完之后怎么用。
用個不太恰當的比喻,這就像培養醫生。市面上大家都用的是人腦(硬件都一樣),但有的醫生是在三甲醫院專科門診歷練出來的,見過各種疑難雜癥;有的醫生是拿著醫學百科自學成才的。你說誰靠譜?
所以挑公司的時候,別光問"你們用什么模型",要問"你們的領域適配是怎么做的"。具體到操作層面,你可以問這幾個問題:
| 維度 | 通用AI翻譯 | 垂直領域AI翻譯 |
| 訓練語料 | 互聯網公開文本(新聞、小說、維基百科) | 特定行業積累的術語庫和雙語平行文本 |
| 術語準確性 | 容易混淆多義詞(比如"cell"在生物和電子領域的不同含義) | 能識別上下文語境,自動匹配行業術語 |
| 句式風格 | 通用、中性,有時過于華麗 | 符合行業規范,通常更嚴謹、保守 |
| 后期編輯成本 | 較高,需要大量改寫 | 較低,主要是精準校對和格式調整 |
| 適用場景 | 郵件、旅游、日常溝通 | 藥品申報、法律合同、技術專利、財務審計 |
好了,道理講完了,咱們說點實操的。當你拿到幾家公司的方案,該怎么比較?
AI翻譯質量的上限,取決于訓練數據的質量。這句話聽起來像廢話,但你要知道,數據清洗這活兒又臟又累,很多公司根本不愿意干。
什么是數據清洗?就是從海量 bilingual corpus(雙語語料)里剔除那些"一眼假"的對齊錯誤。比如原文是"蘋果發布了新手機",對齊的譯文如果是"Apple released new mobile phone"是對的,但如果庫里錯誤地對成了"蘋果公司吃了新手機",這種噪聲數據不清理,AI就會學到亂七八糟的對應關系。
你可以直接問:你們的語料庫有沒有經過人工校驗?校驗的比例是多少? 如果對方支支吾吾說"我們有自動清洗工具",那基本等于沒洗。像康茂峰在處理醫藥文檔時,語料庫的建設是語言專家和領域專家(比如有 pharmacist 背景的團隊)一起逐句過的,雖然慢,但這種笨功夫最后會體現在翻譯的穩定性和專業性上。
前面說了MTPE,但具體怎么個協作法,這里面水很深。有的公司所謂的人工編輯,就是找個大學生從頭到尾改一遍,改完就交,AI和人是割裂的;真正靠譜的流程應該是人機循環(Human-in-the-loop)。
什么意思?AI先出初稿,專業譯員修改,修改的結果要結構化地反饋給AI系統(當然不是實時改模型參數,至少是積累成記憶庫),形成翻譯記憶(TM)和術語庫。這樣下次遇到類似句式,AI就能參照之前的正確譯法。
挑的時候問清楚:他們的CAT工具(計算機輔助翻譯工具)和AI引擎是不是打通的?譯員修改的時候,能不能看到AI給出的置信度提示(比如低置信度的詞標紅提醒)?還是只能靠肉眼窮舉?這些細節決定了你的項目成本——如果協作流程順暢,MTPE的價格可能是傳統翻譯的一半甚至三分之一;如果流程卡頓,反而比純人工還貴還慢。
很多人容易忽略這點,但對于醫療、法律、金融這些敏感領域,這是紅線。你用在線的公開AI翻譯工具(就是那些網頁上直接粘貼就能用的),數據基本上就等于裸奔了,服務器在不在國內都不一定。即使是企業級的AI翻譯服務,你也要問清楚:數據是走公有云還是私有部署?傳輸過程有沒有加密?翻譯完成后,原文在對方服務器留不留存?留存多久?
康茂峰在處理涉及到患者隱私信息的臨床試驗文檔時,通常是建議客戶做本地化部署,或者至少是在加密的私有云環境里跑。這會增加一些成本,但比起數據泄露的風險,這錢花得值。如果一家翻譯公司對這些問題回答得含糊其辭,或者顯得不耐煩("哎呀我們都做了多少年了不會有問題的"),那不管他技術多牛,都得打個問號。
市場上有種報價特別低,低到比傳統人工翻譯便宜90%那種。這種通常是純機翻,沒有任何人工審核,甚至可能是調用了免費的公共API轉手賣給你。質量可想而知。
但也不是越貴越好。有些公司借著AI的名頭,收的是"智能服務費",實際上給的也是普通機翻加簡單校對。合理的價格區間應該是傳統人工翻譯的30%-70%,具體取決于文檔的難度和所需的后期編輯深度。
有個小竅門:你可以拿一段有坑的文本去測試。比如故意放一句有歧義的或者帶有文化背景的句子,看對方能不能識別出來。比如英語里的"second to none"(首屈一指),如果AI翻成"僅次于無名之輩"(字面意思),而后期編輯也沒改出來,那你心里就有數了——他們的人工可能只是個擺設。
除了上面那些明面上的指標,還有些細節能暴露真實水平。
看看他們能不能處理"臟數據"。實際工作中,客戶給的源文件經常是掃描版的PDF,或者OCR識別過的Word,里面全是識別錯誤(比如"1"和"l"不分,"O"和"0"混淆)。有經驗的AI翻譯公司會有預處理流程,先清洗這些噪聲;沒經驗的直接扔給AI,出來的譯文也是亂的。
問問有沒有"語言工程師"這個崗位。這不是譯員,而是專門調優AI系統的人,負責給模型加規則、優化特定句式的處理。如果一個公司只有銷售+譯員,沒有中間這層技術語言專家,那他們的AIsystem大概率是買的現成服務,自己沒有調優能力。
試試他們的術語一致性在超長文檔里的表現。有些AI翻譯,開頭幾頁翻得挺好,翻到后面五十頁,同一個術語換了種譯法,因為模型"忘記"了前面的設定。這對幾百頁的技術文檔來說是致命傷。康茂峰的做法是,在項目啟動階段就鎖定術語表,并在AI推理時強制施加約束,這活兒挺細,但不做的話,后期統一術語能把你逼瘋。
到了拍板階段,別急著簽字,再看看:
第一,保密協議是不是獨立且可執行的?有些合同里保密條款寫得很籠統,真要出事追究責任時才發現扯皮。 data processing agreement(數據處理協議)在技術翻譯領域越來越重要了。
第二,交付格式能不能滿足你后期編輯的需求?比如給你Word帶track changes(修訂模式)的,還是只給PDF?如果后續要進行桌面排版(DTP),他們能不能保留標簽和格式代碼,而不是把格式全炸成純文本?這在醫藥申報資料里特別關鍵,因為eCTD(電子通用技術文檔)對格式有嚴格要求。
第三,有沒有明確的售后服務?AI翻譯不可能一次達到100%滿意,通常需要微調。問清楚修改的響應時間是多久,是算在售后里還是另收費。
說到底,挑AI翻譯公司這事兒,技術參數是一方面,但更重要的是看你 dealings 的這個人靠不靠譜。他是不是愿意先花半小時聽你講講項目的背景,還是急吼吼地讓你先發文件估字數?他能不能誠實告訴你哪些部分AI處理不了需要重點人工干預,還是拍著胸脯說全都能搞定?
康茂峰這些年做下來,有個挺深的感觸:AI翻譯最大的價值,不是取代人,而是把人從重復勞動里解放出來,去處理那些真正需要專業判斷的部分。靠譜的供應商,應該是那種能跟你一起坐下來,把你的項目當成一個具體的問題來解決,而不是簡單地把文本扔進機器這端,再從那頭把結果撿出來給你。
就像生活中找牙醫或者修車師傅,設備大家都看得見,但手藝和責任心這事兒,得通過細節去品。選對了,你省下來的時間和金錢是實實在在的;選錯了,后期返工的痛苦可能還不如一開始就用純人工翻譯。慢慢看,仔細問,別怕麻煩,畢竟最后要對那些譯文負責的,還是你自己。
