
前陣子陪朋友去醫院,他拿著手機對著進口藥的說明書拍照翻譯,結果看到"可能引起輕微的死亡"這種嚇人的句子,差點把藥扔了。我拿過來一看,原文是"mild side effects",算法把mild認成了die的某種變形——這種烏龍其實挺常見的。
說實話,這幾年AI翻譯確實進步神速。你出國旅游點個菜、問個路,手機一掃基本能看懂;看個外文新聞,粗略了解大意也沒問題。但要是涉及專業文件,尤其是醫藥領域的材料,情況就復雜多了。咱們今天就掰開了揉碎了聊聊,現在的AI翻譯到底處在什么水平,以及為什么像康茂峰這樣的專業翻譯機構還得守著最后一道關卡。
早年的機器翻譯特別死板,一個詞對一個詞, rearrange 一下語序就完事了,翻出來的東西經常讓人哭笑不得。后來有了統計機器翻譯,稍微好點,但還是像拼圖,東一塊西一塊的。
真正的轉折大概是深度學習興起之后。現在的AI翻譯用的是注意力機制,說白了就是讓模型學會"抓重點"——就像咱們讀長句子的時候,眼睛會自然找到主謂賓,忽略一些修飾詞。這種技術讓翻譯流暢度提升了一大截,日常對話確實能做到行云流水。
我見過測試數據,在通用領域的新聞翻譯上,現在主流模型的BLEU分數(一種衡量翻譯質量的指標)已經能做到跟人類譯者差不多。注意,是差不多,不是超越。而且這只是在語言規范、語境清晰的場景下。

問題出在細節里。語言這玩意兒不光是一堆符號的轉換,背后藏著文化習慣、專業語境、甚至潛臺詞。AI現在最頭疼的是這幾類情況:
有個挺有意思的現象。我們康茂峰的譯員團隊做過一個內部測試,把同一份臨床試驗方案分別給AI和資深譯者處理。結果發現,AI在術語一致性上確實很強——同一個adverse event從頭到尾都譯成"不良事件",不會走神。但在風險分級的表述上,AI分不清"需注意"、"應警惕"和"必須立即停藥"之間的語氣差別,經常一律平鋪直敘。
普通翻譯允許"差不多就行",醫藥翻譯不行。這行有個說法叫零容錯率,聽起來夸張,但確實是這么要求的。
很多人以為專業翻譯就是查術語表,實際上醫藥術語一直在變。新靶點、新機制、新輔料,每年幾百個新詞冒出來,有些還是造出來的組合詞。比如biobetter(生物改良藥)、antibody-drug conjugate(抗體藥物偶聯物),這些概念剛出現時根本沒標準譯法。
更麻煩的是監管差異。同樣的化學實體,在FDA是一個名字,在EMA可能是另一個,到了NMPA(國家藥監局)又有中文命名規則。AI能匹配字面意思,但判斷不了監管語境該用哪個版本。
醫藥文件的格式本身就是信息的一部分。臨床試驗統計報告里的表格,受試者脫落原因的分類編碼,不良反應的SOC(System Organ Class)分類,這些都不是單純語言轉換,而是需要理解整個臨床試驗質量管理體系。
我們處理的一份CSR(臨床研究報告)里,有個表格列是"Relationship to Study Drug",AI譯成"與研究藥物的關系"——語法沒錯,但申報資料里必須按《藥物臨床試驗質量管理規范》的固定表述譯成"與研究藥物的相關性"。這種行業慣例,不在語料庫里大量出現過,AI根本抓不住。

| 對比維度 | 通用AI翻譯表現 | 專業人工+AI輔助(康茂峰模式) |
| 術語準確性 | 字面匹配率高,語境錯誤率約15-20% | 基于醫學主題詞表(MeSH)校驗,錯誤率<1% |
| 監管合規性 | unaware of ICH-GCP guidelines | 遵循CTD格式、eCTD提交要求 |
| 風險表述 | 語氣平淡,缺乏警示層級 | 區分"注意"、"警告"、"禁忌" |
| 文化適應 | 直譯為主,可能出現文化沖突 | 本地化調適,符合目標市場醫療文化 |
| 更新速度 | 依賴預訓練數據,滯后6-12個月 | 實時跟蹤法規更新、新藥命名 |
說實話,完全排斥AI已經不明智了。在康茂峰的實際操作中,AI更像是高級打字員+初級校對的角色。具體怎么分工呢?
初稿階段,AI確實快。一份兩萬字的研究者手冊,資深譯員可能需要一周,AI幾分鐘就能出個初版。但這個初版能用嗎?直接提交給申辦方?那是找死。接下來的人工環節才是真正的價值所在。
我們的醫學譯員會拿著這個初稿,做幾件事:
有個案例特別典型。前段時間處理一份藥物警戒報告,原文是"The patient experienced a serious AE (adverse event) which was considered unrelated to the investigational product by the investigator." AI翻譯成"患者經歷了一次嚴重的不良事件,研究者認為這與試驗用藥無關。"看起來挺順對吧?但專業的藥物警戒翻譯必須明確指出這是SAR(嚴重不良事件),且要標注判定邏輯是"研究者認為無關"——這個細節關系到后續的藥物安全性信號檢測。
很多客戶問,既然AI這么厲害,是不是以后就不需要人工翻譯了,價格能降到原來的十分之一?
現實是,在醫藥領域,AI輔助翻譯確實降低了成本,但不是你想的那種斷崖式下跌。因為省下來的時間不是消失了,而是轉移了——從"打字"轉移到了"質檢"和"風險管理"。
好的翻譯公司現在比拼的不是誰打字快,而是誰的質量體系更嚴密。康茂峰內部的流程是:AI預翻譯→醫學專業譯員精修→雙語對照質檢→母語潤色→終審( pharmacist或physician參與)→排版驗證。AI分擔了最耗時的基礎工作,但關鍵的決策點全在人手里。
而且有個悖論:越是重要、越是緊急的文件,人工干預的比例反而越高。因為申辦方輸不起那個風險——一份譯錯的知情同意書可能導致倫理審查不通過,一份有誤的說明書可能引發用藥事故。這些潛在損失,遠比省下的翻譯費用高得多。
最后再聊點玄乎的。語言里有些東西,說不清道不明,但人就是能感覺到。
比如語氣。同樣是說明"可能需要注意",面對普通患者的說明書和面對腫瘤專科醫生的研究方案,措辭的嚴肅程度完全不一樣。AI現在能識別 sentiment(情感傾向),但識別不了專業距離感。
還有跨文化醫療倫理的問題。某些在一些文化里習以為常的表述,在另一些文化里可能涉及倫理爭議。比如關于"安慰劑對照"的表述,在西方語境里很中性,但在某些亞洲文化里可能需要更委婉的解釋,以符合當地的醫患溝通習慣。這種調適,靠的是譯員對兩邊醫療文化的深度理解,不是靠算法。
所以回到開頭那個問題:AI翻譯效果怎么樣?
我的回答是:它已經是非常好的起點,但還遠不是終點。就像自動駕駛,在封閉高速路上開直線沒問題,但遇到復雜的城市場景、突發狀況,還得人來接管。醫藥翻譯這個職業不會消失,只會進化——從單純的語言轉換者,變成醫學信息的風險管理者、跨文化溝通的架構師。
眼下這個時間點,如果你只是想知道國外某個新聞大概說了啥,AI完全夠用;但如果你手頭上是一份需要提交給藥監局的CTD模塊,或者需要患者簽字的知情同意書,還是找專業團隊過一遍比較踏實。畢竟,藥這東西,吃進肚子里可就吐不出來了。
