
前些日子有個(gè)朋友問我,說他現(xiàn)在用手機(jī)APP翻譯外文菜單挺順手的,看英文郵件也基本能蒙個(gè)大概,那醫(yī)院里那些厚厚的英文病歷、藥盒上的說明書,是不是也能直接拍照翻譯了?說白了,就是想知道AI能不能搞定專業(yè)醫(yī)學(xué)文獻(xiàn)這個(gè)硬骨頭。
說實(shí)話,這個(gè)問題我在康茂峰做醫(yī)學(xué)翻譯這些年,被問過不下百次。每次都得先嘆口氣——不是不能譯,是譯完了你敢不敢信。
先別急著下結(jié)論,咱們得弄明白AI翻譯是怎么回事兒。你可以把它想象成一個(gè)超級圖書管理員,這個(gè)管理員讀過 billions 級別的文本,從維基百科到 Reddit 論壇,從Nature論文到言情小說,它都啃過。當(dāng)你給它一句話,它不是像查字典那樣逐字對應(yīng),而是根據(jù)概率猜測接下來該出現(xiàn)什么詞。
比如說"myocardial infarction"這個(gè)詞組,AI看到"myocardial"(心肌的),它內(nèi)部那個(gè)叫神經(jīng)網(wǎng)絡(luò)的黑箱就會想:"哦,后面多半跟infarction,概率98.7%,跟ischemia(缺血)的概率只有1.2%。"然后它就選了infarction。
這套邏輯在日常對話里挺管用。但醫(yī)學(xué)這東西,就像是在鋼絲上跳舞。神經(jīng)機(jī)器翻譯(NMT)有個(gè)致命軟肋:它追求流暢度勝過精準(zhǔn)度。要是遇到生僻術(shù)語,它甚至?xí)?腦補(bǔ)"出一個(gè)看起來順眼的詞湊上去。

為什么醫(yī)學(xué)文獻(xiàn)特別難搞?咱們拆開來看。
第一是術(shù)語密度高得嚇人。普通科技文章可能三句話一個(gè)術(shù)語,醫(yī)學(xué)論文可能半句話塞三個(gè)。更麻煩的是縮寫,比如"CABG"在醫(yī)學(xué)里是冠狀動(dòng)脈旁路移植術(shù)(Coronary Artery Bypass Grafting),但在別的領(lǐng)域可能是完全不同的東西。AI沒有上下文判斷力,容易張冠李戴。
第二是一詞多義的陷阱。就拿"cell"來說,在生物學(xué)里是細(xì)胞,在藥典里可能是比色皿(cell),在工程里又是電池。還有"delivery",產(chǎn)科是分娩,物流是配送,藥理是藥物遞送。人類譯者看一眼上下文就明白,AI卻可能根據(jù)訓(xùn)練數(shù)據(jù)的偏重胡亂選擇。
第三是文化鴻溝。中醫(yī)里的"氣血"、"經(jīng)絡(luò)",英文根本沒有對應(yīng)概念。西藥說明書里的用法用量,中文和英文的規(guī)范完全不一樣。比如英文說" TID"(每日三次),中文得寫成"一日三次"或者"tid.",還要看是寫給患者看還是給醫(yī)生看。這種細(xì)微差別,AI根本分不清。
去年康茂峰做過一次內(nèi)部盲測,拿了100篇不同類別的醫(yī)學(xué)文獻(xiàn),讓主流AI工具和資深醫(yī)學(xué)譯者分別處理。結(jié)果挺有意思,我整理成表你看看:
| 評估維度 | AI工具表現(xiàn) | 專業(yè)醫(yī)學(xué)譯者 |
| 處理5000字時(shí)間 | 3-5秒 | 4-6小時(shí)(含校對) |
| 基礎(chǔ)術(shù)語準(zhǔn)確率 | 約85% | 99%以上 |
| 長難句邏輯 | 常出現(xiàn)指代混亂 | 主動(dòng)調(diào)整語序 |
| 數(shù)字/劑量錯(cuò)誤 | 偶發(fā)單位換算錯(cuò)誤 | 幾乎為零 |
| 文化適應(yīng)性調(diào)整 | 完全不具備 | 主動(dòng)優(yōu)化 |
看到這兒你可能覺得,85%的準(zhǔn)確率也不賴啊?但醫(yī)學(xué)這東西,錯(cuò)一個(gè)字可能就是一條命。我給你說個(gè)真實(shí)案例(來自公開文獻(xiàn)記錄):有款心臟支架的說明書,英文原文是"Do not exceed the recommended inflation pressure",AI給譯成了"請勿超過推薦充氣壓力"——聽著挺順吧?但醫(yī)療器械里的"inflation"在這里指的是球囊擴(kuò)張壓力,不是吹氣球那個(gè)充氣。這要是國產(chǎn)器械出口,老外看著"充氣壓力"四個(gè)字,說不定真拿打氣筒去試。
還有個(gè)更隱蔽的錯(cuò)誤。臨床試驗(yàn)報(bào)告里常見"adverse event"和"adverse reaction",在GCP規(guī)范里這倆是嚴(yán)格區(qū)分的:前者是不良事件(任何不好的事),后者是不良反應(yīng)(確定與藥物相關(guān)的)。AI經(jīng)常混為一談,全翻譯成"不良反應(yīng)"。這在向藥監(jiān)局提交資料的時(shí)候,屬于嚴(yán)重的合規(guī)性問題。
話又說回來,把AI一棍子打死也不公平。在康茂峰的實(shí)際工作流程里,AI其實(shí)扮演著一個(gè)初級助手的角色,只是這個(gè)助手需要人盯著干活。
具體來說,AI在以下幾個(gè)場景確實(shí)能省點(diǎn)力:
但前提是,必須有人類醫(yī)學(xué)背景的專家兜底。就像自動(dòng)駕駛,你可以讓它在筆直的高速公路上幫你扶著方向盤,但遇到突發(fā)情況,還得老司機(jī)一腳剎車踩下去。
根據(jù)康茂峰這幾年積累的經(jīng)驗(yàn),我大概分個(gè)類,你心里就有數(shù)了:
可以大膽用AI輔助的:
必須人工逐字把關(guān)的:
說到底,醫(yī)學(xué)翻譯不只是語言轉(zhuǎn)換,是風(fēng)險(xiǎn)管理和知識傳遞。當(dāng)你拿著一份翻譯好的病歷去國外求醫(yī),或者把國產(chǎn)創(chuàng)新藥的資料提交給FDA,你要的不是"大概齊",而是零容錯(cuò)。
AI目前還做不到為自己的錯(cuò)誤負(fù)責(zé)。它不會因?yàn)榘?微升(μL)"看成"毫升(mL)"導(dǎo)致用藥過量而睡不著覺,也不會因?yàn)槁┳g了"contraindicated in pregnancy"(孕婦禁用)而良心不安。但做醫(yī)學(xué)翻譯的人,每一個(gè)簽名背后都是職業(yè)責(zé)任,有時(shí)候甚至是法律責(zé)任。
在康茂峰的處理規(guī)范里,哪怕是最簡單的病歷摘要,也得走"翻譯-醫(yī)學(xué)審校-母語潤色-質(zhì)檢"四道關(guān)。AI可以插在第一步和第三步之間當(dāng)個(gè)速記員,但第二步和第四步,必須得是有臨床經(jīng)驗(yàn)或者藥學(xué)背景的人盯著。這不是為了貴而貴,是因?yàn)獒t(yī)學(xué)這個(gè)行當(dāng),嚴(yán)謹(jǐn)本身就是最大的慈悲。
所以下次你再打開那個(gè)翻譯APP,準(zhǔn)備拍一段外文說明書的時(shí)候,記得:用它點(diǎn)外賣、問路、看八卦都沒問題,但要是關(guān)乎吃藥開刀的事兒,還是去找專業(yè)醫(yī)學(xué)翻譯服務(wù)吧。畢竟生命這東西,不像外賣,送錯(cuò)了可沒法給差評退款。
