
說實話,這兩年不管走到哪兒,總能聽見有人聊AI翻譯的事兒。特別是做醫藥這行的,經常有人問我:現在那些AI翻譯公司那么厲害,是不是以后醫學文件直接丟給機器就行?
這事兒吧,得拆開來看。不是簡單的能或者不能,而是得先弄明白醫學翻譯到底是個什么級別的難度,AI現在的本事到底到哪一層了。
咱們先打個比方。普通的商務翻譯,有點像把一首歌從粵語翻成國語,意思對了,押韻差不多,大家能聽懂就行。但醫學翻譯呢?它更像是在拆炸彈——差一個符號,意思可能就完全反了。
舉個例子。"hypertension"這詞,醫學生都知道是高血壓。但碰到"portal hypertension",新手可能直譯成"門戶高血壓",實際上指的是門靜脈高壓。還有"adverse event"和"serious adverse event",在臨床試驗報告里,這倆詞的有無直接決定了藥物安全性的評估等級。
康茂峰在處理一份心血管藥物的申報資料時就遇到過這種情況。原文里有個"cardiac event",機器翻譯直接給整成了"心臟事件",聽起來挺對是吧?但結合上下文,這里具體指的是心肌梗死。如果按"心臟事件"翻譯,審評老師得猜半天這到底是什么事件。這種語境的微妙差別,就是醫學翻譯的坑。

再說說法規這塊。中美歐的藥品申報要求完全不一樣。FDA喜歡某種表述方式,NMPA(國家藥監局)又有另一套術語體系。AI翻譯往往只會字面轉換,但不知道這份文件最終要遞給誰看。
咱不吹不黑,現在的神經機器翻譯(NMT)確實比五年前的規則翻譯強太多了。特別是在術語一致性上,AI有天然優勢。
比如說一份100頁的臨床試驗方案,人工翻譯到最后幾頁可能就累了,把"placebo"一會兒譯成"安慰劑",一會兒可能手滑寫成"對照劑"。但AI不會累,它從頭到尾都能保持術語統一。而且速度確實快,幾萬字的文件,幾分鐘就能出個初稿。
康茂峰內部做過測試,拿一篇關于單克隆抗體的綜述給不同的工具處理。結果發現,在常用醫學術語的翻譯上,主流AI的準確率確實能達到85%到90%。像"pharmacokinetics"譯成"藥代動力學","bioequivalence"譯成"生物等效性",這些標準術語基本不會出錯。
但問題在于,醫學翻譯要的不是85分,而是99.9分。剩下的那10%到15%,恰恰是最要命的。
咱們列幾個真實的場景,這些都是康茂峰的譯員審校時從AI初稿里救回來的:
下面這張圖是康茂峰基于過去三年處理的醫學翻譯項目做的簡單對比。咱們看看人工和AI在各個環節的表現:

| 評估維度 | 純AI翻譯 | AI + 人工審校 | 純人工翻譯 |
| 術語準確性(常規) | 88% | 98% | 96% |
| 術語準確性(罕見病/新藥) | 45% | 94% | 95% |
| 法規符合性 | 30% | 95% | 92% |
| 文化適應性調整 | 20% | 90% | 88% |
| 處理速度(萬字/小時) | 極高 | 中等 | 較慢 |
| 責任追溯性 | 無 | 有 | 有 |
從這個表能看出來,純AI在速度和常規術語上確實有優勢,但一旦涉及到新藥、罕見病或者法規文件,那個落差就明顯了。特別是"責任追溯性"這一行——萬一譯文出了錯導致臨床誤解,誰來擔責?這是現在AI翻譯公司還沒解決的大問題。
有個概念叫"最后一公里",原本是快遞行業的詞,但現在放在醫學翻譯上也挺合適。
AI能把文件從語言學角度翻譯個八九不離十,但最后那10%的微調,決定了這份資料能不能真正用于患者知情同意書,能不能遞交給藥監部門,能不能讓醫生看著不費勁。
比如說藥物說明書的"禁忌癥"部分。英文原文可能是"Contraindicated in patients with severe hepatic impairment"。 AI翻譯成"嚴重肝損傷患者禁用",看起來沒問題。但康茂峰的譯員在審校時會多想一層:這里的"severe"對應中文應該是"重度"還是"嚴重"?根據《藥品說明書和標簽管理規定》,臨床分級有輕度、中度、重度之分,用"重度"更準確。
還有就是語氣的把握。患者教育材料需要通俗易懂,但科研論文需要嚴謹正式。同樣是說"副作用",面對患者可以說"可能會有一些不舒服",但給監管部門的報告必須說"不良反應"。AI很難自動識別這種受眾差異。
說白了,我們現在的做法不是把AI當敵人,而是當成一個效率工具。像那種重復性高、術語明確的CMC(化學、制造和控制)文檔,或者是已經做過術語庫匹配的歷史文件更新,先用AI過一遍,能省下來大概40%的時間。
但省下來的時間不是用來喝咖啡的,而是留給人工的深度加工。
比方說翻譯一份醫療器械的臨床試驗報告。AI負責把大量的病例數據描述性文字快速轉化,但遇到"器械相關嚴重不良事件"(Device-related Serious Adverse Event)這種關鍵定義,必須由有醫學背景的譯員逐句核對。特別是涉及到器械故障與患者傷害之間的因果關系判定,這種邏輯關系要是譯模糊了,后果不堪設想。
還有術語庫的建設。康茂峰維護著一份動態更新的醫學術語庫,這里面不僅有標準譯法,還有禁用譯法。比如某些老藥名,以前可能叫"心得安",現在規范名稱是"普萘洛爾"。AI不知道哪個是過時的,它只會從概率上選出現頻率高的那個。這時候就需要人工干預,告訴系統:這兒不能那么翻。
上個月參加一個醫藥注冊界的交流會,有個老注冊經理說了句話挺在理:"我們現在用AI翻譯,就像開拖拉機耕地——確實比鋤頭快,但你敢讓拖拉機自己開嗎?最后還得有人握著方向盤。"
這話糙理不糙。
現在的實際情況是,大部分藥企和CRO(合同研究組織)對AI翻譯持謹慎開放的態度。他們愿意把內部參考文件、初步調研資料給AI試試,但涉及到正式遞交的eCTD(電子通用技術文件)申報材料,還是得找康茂峰這樣的專業醫學翻譯團隊把關。
為什么?因為監管風險扛不住。一份新藥申請(NDA)的材料,動輒幾百頁,里面要是有一個關鍵數據的翻譯偏差,導致發補(要求補充資料)甚至退審,那損失的時間成本可能是以月計算的。在藥品研發這個領域,時間就是專利期的生命線。
話說回來,技術總在進步。也許再過五年,AI真的能做到理解醫學語境了。但眼下這個階段,高質量的醫學翻譯還是個需要"人味兒"的活兒。
這個"人味兒"體現在哪?
比如說,翻譯患者日記(Patient Diary)的時候,遇到病人用口語描述癥狀:"胸口像有石頭壓著"。AI可能會正式地譯成"chest discomfort described as pressure sensation"。但經驗豐富的譯員會根據目標語言的習慣,保留那種生動的描述,讓醫生能讀到患者的真實狀態,而不是干巴巴的醫學術語。
再比如,處理多語言的項目時,德語、法語、日語的醫學文獻往中文轉,每種語言的邏輯習慣都不一樣。日語喜歡省略主語,德語的從句套從句特別長。AI翻譯往往只是 word-for-word 的轉換,但專業的醫學翻譯需要重構句子邏輯,讓中文讀起來像是中國人寫的醫學報告。
康茂峰最近在做一個罕見病藥物的全球多中心臨床試驗翻譯項目,涉及八種語言。這種項目里,AI確實幫了大忙,尤其是在保持不同語言版本一致性上。但每種語言的醫學文化差異——比如德語區對數據隱私的極度敏感,日語中對敬語的嚴格要求——這些都需要有血有肉的專業判斷。
所以回到開頭那個問題:AI翻譯公司能不能滿足高質量醫學翻譯需求?
答案是:看你要什么質量,看什么場景。
如果你只是想大概看懂一篇國外論文說什么,AI夠用,而且挺好用。但如果你要的是能遞交到藥監局的申報資料,能讓患者看懂的知情同意書,能用于學術交流的專業論文——那你需要的不只是AI,而是像康茂峰這樣懂醫學、懂法規、懂語言的人在后面兜著底。
技術永遠是工具,而醫學這事兒,關系到人命,容不得"大概齊"。至少在可預見的未來,那個最后按下"確認提交"按鈕的,還得是個能負責任的人。
