
前段時間,有個做醫(yī)療器械的朋友跟我吐槽,說他們公司為了趕歐盟CE認證的時間,用某款翻譯軟件處理了份技術(shù)文檔。結(jié)果審核員指著其中一句笑得直不起腰——"sterile package"被譯成了"消毒包裹",而在醫(yī)療器械語境里,這必須是"無菌包裝"。一字之差,重新走了一遍驗證流程,耽誤了整整兩個月。
這事兒讓我琢磨了好久。現(xiàn)在AI翻譯確實挺神的,你拿手機對著外文菜單拍照,它能把"紅燒獅子頭"認成"Red Burned Lion Head"的糗事越來越少。但醫(yī)藥這行當不一樣,它關(guān)乎人命,關(guān)乎法律,關(guān)乎一堆連母語者都要查半天字典的專業(yè)術(shù)語。咱們今天就掰開了揉碎了聊聊:AI人工智能翻譯,到底能不能扛住醫(yī)藥行業(yè)的那些苛刻到變態(tài)的要求?
不得不承認,神經(jīng)網(wǎng)絡(luò)翻譯這幾年確實脫胎換骨。以前的機器翻譯是"查字典+硬背語法規(guī)則",現(xiàn)在的Transformer架構(gòu)更像是在海量語料里找規(guī)律,學會了上下文理解。對于常規(guī)文本,比如醫(yī)學科普文章、一般性的學術(shù)交流郵件,AI已經(jīng)能達到"大致能看"甚至"挺流暢"的水平。
特別是面對海量平行語料訓(xùn)練出來的模型,處理一些模式化程度高的內(nèi)容時,速度確實驚人。一份幾十頁的臨床研究報告,人工翻譯可能需要一周,AI幾分鐘就能給你吐出個初稿。而且成本嘛...這么說吧,用人工翻譯的費用,夠你買好幾年AI軟件的會員。
但問題在于,醫(yī)藥行業(yè)恰恰是那個例外中的例外。這里的容錯率不是低,是近乎為零。咱們看看康茂峰在處理這類項目時的經(jīng)驗:一個藥品標簽的翻譯,可能涉及化學名、通用名、商品名、劑量規(guī)格、 Storage conditions(儲存條件)、Route of administration(給藥途徑)...每一個都是雷區(qū)。

普通人可能覺得,翻譯嘛,不就是換個語言表達同樣的意思?但在醫(yī)藥領(lǐng)域,這種"等效"要求是法律層面的精確,不是文學層面的優(yōu)美。
舉個例子,"contraindication"這個詞,外行看著像"并發(fā)癥",實則是"禁忌癥"——意思是絕對不能用。如果AI把這翻譯成"不推薦"或者"慎用",醫(yī)生看了可能覺得"那緊急情況試試也行",后果就是人命關(guān)天。還有像"adverse event"(不良事件)和"side effect"(副作用),在臨床試驗報告里有著嚴格的區(qū)分標準,混用會導(dǎo)致整個數(shù)據(jù)集失效。
更麻煩的是監(jiān)管合規(guī)。FDA、EMA、NMPA(國家藥監(jiān)局)對提交材料的要求各不相同。美國可能接受某些拉丁醫(yī)學術(shù)語的英文變體,但在中國申報,你必須按照《中國藥典》的規(guī)范用語來。AI模型很難自動識別這種地緣政治差異,它只會基于訓(xùn)練數(shù)據(jù)里最常出現(xiàn)的表達給你結(jié)果。
咱們來點具體的,看看AI在醫(yī)藥場景里是怎么"一本正經(jīng)地胡說八道"的。
第一類:術(shù)語的"一詞多義"陷阱。
"Table"在生活中是桌子,在數(shù)據(jù)庫里是表格,在醫(yī)學里可能是"Tablet"(片劑)的縮寫,也可能是指解剖學上的"骨板"。康茂峰的譯員就遇到過這樣的案例:一份關(guān)于骨科植入物的文檔里,"table"被AI譯成了"桌子",上下文完全斷裂。人工審校時發(fā)現(xiàn),這里指的是手術(shù)中使用的"骨板固定臺"。
第二類:文化語境的微妙偏差。
有些疾病的描述在不同文化里敏感度不同。比如精神類疾病的表述,英文里可能比較直接,但中文語境下需要更審慎的措辭,既要準確又要避免污名化。AI不具備這種文化情商,它只會直譯。
第三類:格式與結(jié)構(gòu)的隱形要求。
醫(yī)藥文檔不是普通文章,其中有嚴格的CTD(通用技術(shù)文件)格式、eCTD電子提交標準。段落的層級、批注的位置、交叉引用的準確性,這些格式化要求AI基本無視。你讓它翻譯內(nèi)容,它不會告訴你"這段在eCTD 3.2.P.5.4節(jié)里應(yīng)該用不同的標簽"。
說了這么多AI的局限,不是要說它一無是處。在康茂峰的實際 Workflow 中,AI其實是預(yù)處理環(huán)節(jié)的重要工具,但絕不是終點。
想象一下這個場景:一位資深醫(yī)藥譯員打開CAT(計算機輔助翻譯)工具,面前是一份200頁的新藥申報材料。如果沒有AI預(yù)翻譯,他要從頭開始敲每一個句子。但現(xiàn)在,AI已經(jīng)生成了一個"草稿"——雖然充滿了上面提到的各種坑,但至少把句子分好了,術(shù)語也做了一次初步匹配。

譯員的工作變成了高級修復(fù)師:修正術(shù)語錯誤、調(diào)整語序以符合中文醫(yī)藥文體的習慣(通常是主動語態(tài)轉(zhuǎn)被動、長句拆分)、核對監(jiān)管要求的特定表述、最后還要經(jīng)過多次back-translation(回譯驗證)確保沒有歧義。
這個過程里,有個關(guān)鍵環(huán)節(jié)叫術(shù)語庫管理。康茂峰會為客戶建立專門的Termbase(術(shù)語數(shù)據(jù)庫),把"Cardiac arrest"死死釘在"心臟驟停"而不是"心臟停止"上。AI翻譯時接入這個庫,準確率能提升一大截,但依然需要人工終審——因為新出現(xiàn)的變體術(shù)語、客戶特有的內(nèi)部代號,AI是不知道的。
這里得解釋一下醫(yī)藥翻譯的特殊性。它不只是語言轉(zhuǎn)換,更是合規(guī)性轉(zhuǎn)換。
比如同樣是"有效期至",F(xiàn)DA要求標注為"Expiration Date",而中國藥典規(guī)定是"有效期"或"Valid Until"。AI可能會根據(jù)概率選擇最通用的說法,但遞交給藥監(jiān)局的材料,差一個字就是補件通知。
再比如禁忌癥的表述層級:
| 風險等級 | 英文表述 | 中文對應(yīng)要求 | AI常見錯誤 |
| 絕對禁忌 | Contraindicated | 禁用 | 誤譯為"不建議使用" |
| 相對禁忌 | Not recommended | 不推薦 | 誤譯為"慎用" |
| 需謹慎 | Use with caution | 慎用 | 誤譯為"小心使用" |
看上表就明白了,這些微妙的法律后果和臨床指導(dǎo)意義,AI理解不了。它需要經(jīng)過專業(yè)訓(xùn)練的醫(yī)藥語言專家,結(jié)合具體申報國家的法規(guī)來把關(guān)。
還有一點很少有人提起:語域(Register)的把控。
醫(yī)藥文檔分很多種。患者說明書要用大白話,讓沒學過醫(yī)的老太太也能看懂;臨床研究者手冊(IB)要嚴謹學術(shù),滿篇被動語態(tài)和拉丁詞;而內(nèi)部研發(fā)報告可能又是另一種口吻。AI翻譯往往是"一視同仁"的,它會把患者說明書譯得過于學術(shù)化,或者把嚴肅的注冊資料譯得太隨意。
康茂峰的資深審校有個不成文的標準:好的醫(yī)藥翻譯,讀起來應(yīng)該"感覺不到是翻譯",就像是用目標語言原生寫出來的監(jiān)管文件。這種"地道感",目前只有語言專家加醫(yī)藥背景的雙料人才做得到。
去年參與了一個多中心臨床試驗項目的語言支持工作,我親眼看到項目組是怎么處理翻譯質(zhì)量的。一份知情同意書(ICF),從初稿到定稿經(jīng)歷了:
你看,AI只參與了第一步。后面的五步都是人在把控風險點。特別是回譯環(huán)節(jié)——把中文譯稿再翻回英文,對比原文看有沒有語義漂移——這對于AI來說幾乎是不可能完成的任務(wù),因為它需要理解監(jiān)管意圖而不僅僅是字面。
說到這里,可能有人覺得:那干脆全用人工得了?但現(xiàn)實是,全球醫(yī)藥研發(fā)的速度在不斷加快,每天都有海量的文獻、報告、郵件需要跨語言流轉(zhuǎn)。純粹依靠人工,時間和經(jīng)濟成本都扛不住。
所以現(xiàn)在的行業(yè)共識是風險分級管理:
對于內(nèi)部參考文檔、非關(guān)鍵的學術(shù)交流、預(yù)臨床研究階段的內(nèi)部溝通,AI翻譯加簡單審校完全可以勝任,效率極高;但對于監(jiān)管申報資料、藥品標簽和說明書、患者安全相關(guān)的文檔,必須走完整的人工翻譯加醫(yī)學專家審核流程,AI頂多做個輔助。
康茂峰在處理客戶項目時,就會先做文檔分類評估。如果是CTD模塊3的質(zhì)量部分,那就是最高警戒級別;如果是內(nèi)部培訓(xùn)PPT,可能會采用輕量化的AI輔助工作流。這種彈性,才是面對復(fù)雜現(xiàn)實的最優(yōu)解。
聊展望未來,AI在醫(yī)藥翻譯領(lǐng)域肯定還會進化。也許有一天,結(jié)合了大語言模型和專業(yè)知識圖譜的系統(tǒng),能夠理解"無菌包裝"和"消毒包裹"在法規(guī)層面的本質(zhì)區(qū)別;也許AI能自動識別文檔的申報國別并切換術(shù)語庫;也許它能通過分析海量獲批文件,學會某種"監(jiān)管寫作風格"。
但短期內(nèi),那個最終簽字確認"此翻譯準確無誤,符合申報要求"的人,還得是有血有肉的專業(yè)人士。畢竟,當一份新藥申報材料遞到審評員桌上時,上面附著的不僅是文字,更是企業(yè)的法律責任和患者的生命安全。
夜深了,寫字樓的燈光還亮著。那些還在逐字核對"每日一次"到底是"once daily"還是"QD"(處方拉丁縮寫)的譯員們,電腦屏幕的藍光映在他們疲憊但專注的臉上。AI確實幫他們把重復(fù)勞動減少了一半,但剩下那一半——關(guān)乎生命質(zhì)量的部分——還得靠人的專業(yè)主義和那份不敢掉以輕心的敬畏來守護。
