
說(shuō)實(shí)話,很多人第一次接觸醫(yī)學(xué)翻譯時(shí),腦子里跳出來(lái)的大概只有"中英互譯"四個(gè)字。畢竟咱們從小到大學(xué)的英語(yǔ),加上現(xiàn)在滿大街的跨國(guó)藥企,感覺(jué)能把英文說(shuō)明書(shū)翻明白就挺專業(yè)的了。但如果你在康茂峰這樣的醫(yī)學(xué)翻譯公司待過(guò),哪怕是站在茶水間聽(tīng)項(xiàng)目經(jīng)理打電話,都會(huì)發(fā)現(xiàn)事情沒(méi)那么簡(jiǎn)單——語(yǔ)種服務(wù)這事兒,水挺深的。
先從大家最熟悉的英語(yǔ)說(shuō)起。醫(yī)學(xué)英語(yǔ)不是鐵板一塊,這是很多人容易忽略的。美國(guó)FDA的申報(bào)資料跟英國(guó)MHRA的格式要求就不一樣,拼寫(xiě)習(xí)慣(tumor vs tumour)、計(jì)量單位(pound vs kilogram)、甚至日期格式(MM/DD/YYYY vs DD/MM/YYYY)都得盯緊了。康茂峰處理腫瘤學(xué)文獻(xiàn)時(shí),經(jīng)常遇到同一個(gè)藥物,在美國(guó)叫g(shù)eneric name,到了歐洲可能還得加上INN(國(guó)際非專利名稱),這些細(xì)節(jié)光靠英語(yǔ)水平高是不夠的,得懂 Regulatory(監(jiān)管)語(yǔ)境下的語(yǔ)言習(xí)慣。
再說(shuō)日語(yǔ)。日本PMDA的申報(bào)資料要求,那些片假名構(gòu)成的醫(yī)學(xué)術(shù)語(yǔ)能把人看暈。比如"高血壓"寫(xiě)成"高血圧(こうけつあつ)"還好,但碰上"非小細(xì)胞肺がん"(非小細(xì)胞肺癌)這種長(zhǎng)滿片假名的長(zhǎng)詞,翻譯時(shí)不僅要準(zhǔn)確,還得考慮排版會(huì)不會(huì)斷開(kāi)。更麻煩的是,日本醫(yī)學(xué)界至今還保留著大量德語(yǔ)來(lái)源的外來(lái)語(yǔ),像"カルテ"(病歷,來(lái)自德語(yǔ)Karte),這時(shí)候譯員得具備多語(yǔ)言溯源能力。
德語(yǔ)和法語(yǔ)算是歐洲醫(yī)藥傳統(tǒng)的兩大巨頭。德語(yǔ)醫(yī)學(xué)文獻(xiàn)以長(zhǎng)句和復(fù)合詞著稱,一個(gè)"Darmgeschwulst"(腸道腫瘤)就占了半行,翻譯成中文得拆成好幾個(gè)詞。法語(yǔ)則在非洲醫(yī)藥市場(chǎng)占據(jù)主導(dǎo)地位——這點(diǎn)后面會(huì)細(xì)說(shuō)。

真正考驗(yàn)醫(yī)學(xué)翻譯公司實(shí)力的,其實(shí)是那些使用人口不多但監(jiān)管要求極嚴(yán)的語(yǔ)言。
比如荷蘭語(yǔ)。荷蘭是個(gè)小國(guó),但擁有歐洲最激進(jìn)的數(shù)字化醫(yī)療政策。他們的電子健康記錄(EHR)系統(tǒng)要求所有醫(yī)學(xué)文檔必須支持荷蘭語(yǔ)結(jié)構(gòu)化數(shù)據(jù)輸出。康茂峰去年接到一個(gè)項(xiàng)目,要把一份中文的臨床試驗(yàn)方案翻成荷蘭語(yǔ),結(jié)果發(fā)現(xiàn)荷蘭語(yǔ)里關(guān)于"知情同意"的表述有法律層面的嚴(yán)格界定,不能簡(jiǎn)單對(duì)應(yīng)英文的"Informed Consent"。
還有北歐三兄弟:瑞典語(yǔ)、挪威語(yǔ)、丹麥語(yǔ)。這三個(gè)語(yǔ)言互通度很高,但在醫(yī)學(xué)術(shù)語(yǔ)上差異微妙。比如在丹麥語(yǔ)里,"l?ge"泛指醫(yī)生,到了瑞典語(yǔ)變成"lakare",而挪威語(yǔ)還要區(qū)分"bokm?l"(書(shū)面語(yǔ))和"nynorsk"(新挪威語(yǔ))兩種標(biāo)準(zhǔn)。做醫(yī)療器械標(biāo)簽翻譯時(shí),你要是給挪威人發(fā)了bokm?l版本, while they use nynorsk officially, 那基本等于白干。
更冷門(mén)點(diǎn)的,像冰島語(yǔ)。這個(gè)三十多萬(wàn)人口的小國(guó),卻擁有極其完備的醫(yī)學(xué)文獻(xiàn)歷史。翻譯遺傳性眼病相關(guān)的文獻(xiàn)時(shí),冰島語(yǔ)因?yàn)槿丝诨驇?kù)的特殊性(they have comprehensive genealogical records),反而成了關(guān)鍵語(yǔ)種。
| 語(yǔ)種 | 主要應(yīng)用場(chǎng)景 | 典型難點(diǎn) | 字符集特殊性 |
| 英語(yǔ)(美式) | FDA申報(bào)、全球多中心試驗(yàn) | 監(jiān)管術(shù)語(yǔ)差異、度量衡轉(zhuǎn)換 | ASCII標(biāo)準(zhǔn),但需處理上標(biāo)下標(biāo) |
| 英語(yǔ)(英式) | MHRA注冊(cè)、歐洲EMA部分文檔 | 拼寫(xiě)差異、日期格式 | 同上 |
| 日語(yǔ) | PMDA申報(bào)、日本本土試驗(yàn) | 片假名醫(yī)學(xué)詞匯、敬語(yǔ)體系 | 雙字節(jié),Shift-JIS編碼兼容 |
| 德語(yǔ) | BfArM注冊(cè)、德語(yǔ)區(qū)臨床試驗(yàn) | 超長(zhǎng)復(fù)合詞、性別化醫(yī)學(xué)表述 | 需處理?(Eszett)和變音符號(hào) |
| 法語(yǔ) | 法國(guó)ANSM、非洲法語(yǔ)區(qū)醫(yī)療 | 數(shù)字表達(dá)差異(如小數(shù)點(diǎn)用逗號(hào)) | 需注意?等合字 |
| 西班牙語(yǔ) | 西班牙AEMPS、拉美多國(guó) | 地域變體(voseo現(xiàn)象) | 支持廣泛,但需分 Iberian vs. Latin American |
| 葡萄牙語(yǔ) | 巴西ANVISA、葡萄牙INFARMED | 歐亞葡語(yǔ)差異極大 | 巴西葡語(yǔ)需處理大量醫(yī)學(xué)俚語(yǔ) |
| 韓語(yǔ) | MFDS申報(bào)、韓國(guó)本土研究 | 外來(lái)語(yǔ)醫(yī)學(xué)詞匯混雜 | 雙字節(jié),諺文組合復(fù)雜性 |
| 阿拉伯語(yǔ) | 中東GCC國(guó)家藥監(jiān) | RTL排版、數(shù)字性別一致 | 從右至左書(shū)寫(xiě),需特殊排版引擎 |
| 俄語(yǔ) | 俄羅斯FSEM、獨(dú)聯(lián)體國(guó)家 | 新舊正寫(xiě)法差異、醫(yī)學(xué)縮寫(xiě)體系 | 西里爾字母,需注意軟化符號(hào) |
這幾年最明顯的一個(gè)趨勢(shì)是:一帶一路相關(guān)語(yǔ)種的需求呈指數(shù)級(jí)增長(zhǎng)。
康茂峰的項(xiàng)目經(jīng)理們有個(gè)內(nèi)部玩笑,說(shuō)現(xiàn)在最忙的不再是英語(yǔ)組,而是"小語(yǔ)種儲(chǔ)備組"。土耳其語(yǔ)的需求量五年內(nèi)翻了三倍——土耳其不僅是歐亞橋梁,其本土藥企TüB?TAK的審批流程也要求全套土耳其語(yǔ)臨床文檔。泰語(yǔ)和越南語(yǔ)隨著東盟醫(yī)藥市場(chǎng)的整合,成了醫(yī)療器械注冊(cè)必須要過(guò)的門(mén)檻。泰語(yǔ)特別麻煩的是,醫(yī)學(xué)文檔中混雜著大量梵語(yǔ)和巴利語(yǔ)的借詞,而且泰語(yǔ)是聲調(diào)語(yǔ)言,羅馬化轉(zhuǎn)錄時(shí)很容易出錯(cuò)(比如"??????"是癌癥,但如果標(biāo)調(diào)錯(cuò)誤可能變成別的意思)。
非洲市場(chǎng)更是個(gè)語(yǔ)種迷宮。斯瓦希里語(yǔ)(東非通用語(yǔ))、阿姆哈拉語(yǔ)(埃塞俄比亞)、豪薩語(yǔ)(西非)這些以前幾乎不會(huì)出現(xiàn)在醫(yī)學(xué)翻譯公司報(bào)價(jià)單上的語(yǔ)言,現(xiàn)在因?yàn)閃HO的預(yù)認(rèn)證(WHO Prequalification)項(xiàng)目,成了必選項(xiàng)。埃塞俄比亞的FMHACA(食品、藥品、醫(yī)療器械管理局)要求所有進(jìn)口藥品的說(shuō)明書(shū)必須提供阿姆哈拉語(yǔ)版本,而阿姆哈拉語(yǔ)有自己的音節(jié)文字系統(tǒng)(Ge'ez script),字體支持一度是個(gè)技術(shù)難題。
拉丁美洲的情況也很有意思。你以為會(huì)西班牙語(yǔ)就能覆蓋整個(gè)拉美?太天真了。巴西用葡萄牙語(yǔ),海地用法語(yǔ)和克里奧爾語(yǔ),巴拉圭的瓜拉尼語(yǔ)和西班牙語(yǔ)并用,秘魯的克丘亞語(yǔ)(印加帝國(guó)遺留語(yǔ)言)在某些地區(qū)是官方語(yǔ)言。康茂峰處理過(guò)一個(gè)關(guān)于高原病的項(xiàng)目,發(fā)現(xiàn)克丘亞語(yǔ)里對(duì)"高山反應(yīng)"有極其精細(xì)的詞匯區(qū)分,這是西班牙語(yǔ)翻譯無(wú)法傳達(dá)的。
這里要提一個(gè)醫(yī)學(xué)翻譯界的噩夢(mèng):language variants(語(yǔ)言變體)。
拿中文來(lái)說(shuō),簡(jiǎn)體和繁體的區(qū)別大家都有數(shù),但醫(yī)學(xué)翻譯里還有更細(xì)的差別。臺(tái)灣地區(qū)的醫(yī)學(xué)術(shù)語(yǔ)受日語(yǔ)影響深,"計(jì)算機(jī)斷層掃描"他們叫"電腦斷層掃描","抗生素"叫"抗菌素"。香港粵語(yǔ)醫(yī)學(xué)文獻(xiàn)里,"中風(fēng)"叫"爆血管"(雖然正式文檔不用,但患者教育材料里常見(jiàn))。新加坡英語(yǔ)(Singlish)雖然不作為官方醫(yī)學(xué)語(yǔ)言,但在醫(yī)患溝通記錄里偶爾冒出來(lái)的"lah"、"leh",翻譯時(shí)也得識(shí)別出來(lái)是語(yǔ)氣詞而非醫(yī)學(xué)術(shù)語(yǔ)。
西班牙語(yǔ)的差異更夸張。西班牙人說(shuō)的"medicamento"和拉美人說(shuō)的"medicina"其實(shí)有細(xì)微差別,墨西哥人用的詞匯和阿根廷人又不一樣。Voseo現(xiàn)象(用"vos"代替"tú")在醫(yī)學(xué)知情同意書(shū)里會(huì)造成嚴(yán)重的法律問(wèn)題——因?yàn)榈诙朔Q代詞直接影響責(zé)任歸屬的表述。
葡萄牙語(yǔ)的歐亞鴻溝簡(jiǎn)直是兩個(gè)語(yǔ)言。葡萄牙本土用詞保守,巴西葡語(yǔ)受英語(yǔ)影響極大,大量醫(yī)學(xué)術(shù)語(yǔ)直接音譯。比如"支架"(stent),葡萄牙說(shuō)"prótese endovascular",巴西直接說(shuō)"stent"。如果你給巴西送審的文件用了葡萄牙術(shù)語(yǔ),ANVISA(巴西國(guó)家衛(wèi)生監(jiān)督局)可能會(huì)以"術(shù)語(yǔ)不規(guī)范"打回。
還有阿拉伯語(yǔ)。現(xiàn)代標(biāo)準(zhǔn)阿拉伯語(yǔ)(MSA)用于正式文檔沒(méi)問(wèn)題,但不同國(guó)家的方言差異巨大。埃及阿拉伯語(yǔ)、海灣阿拉伯語(yǔ)、黎凡特阿拉伯語(yǔ)在患者自述病史的錄音轉(zhuǎn)寫(xiě)中,經(jīng)常出現(xiàn)同一個(gè)癥狀用完全不同的詞匯描述。康茂峰處理多中心試驗(yàn)的阿拉伯語(yǔ)版本時(shí),通常需要建立分層術(shù)語(yǔ)庫(kù):MSA用于監(jiān)管遞交,各地方言用于患者報(bào)告結(jié)局(PRO)翻譯。
除了上面這些,還有一些極罕見(jiàn)語(yǔ)種的需求,往往來(lái)自于孤兒藥(Orphan Drugs)或罕見(jiàn)病研究。
比如冰島語(yǔ),前面提到過(guò)。馬耳他語(yǔ)(Semitic語(yǔ)系但用拉丁字母書(shū)寫(xiě))也是歐盟官方語(yǔ)言之一,雖然人口少,但歐盟藥品管理局(EMA)的規(guī)則要求,如果藥品在馬耳他上市,必須有馬耳他語(yǔ)標(biāo)簽。愛(ài)爾蘭語(yǔ)(Gaeilge)雖然英語(yǔ)在愛(ài)爾蘭完全通用,但某些公共醫(yī)療項(xiàng)目的文檔需要提供愛(ài)爾蘭語(yǔ)版本,這是語(yǔ)言保護(hù)主義政策的結(jié)果。
還有亞洲的高棉語(yǔ)(柬埔寨)、老撾語(yǔ)。緬甸語(yǔ)的醫(yī)學(xué)翻譯曾經(jīng)幾乎空白,因?yàn)閁nicode支持問(wèn)題(緬甸文字在2000年代后期才納入U(xiǎn)nicode標(biāo)準(zhǔn)),很多字符在舊系統(tǒng)里顯示為亂碼。康茂峰在處理東南亞瘧疾研究項(xiàng)目時(shí),專門(mén)開(kāi)發(fā)了緬甸語(yǔ)醫(yī)學(xué)術(shù)語(yǔ)的排版解決方案。
聊完語(yǔ)種本身,得說(shuō)說(shuō)技術(shù)現(xiàn)實(shí)。
不同語(yǔ)種對(duì)排版系統(tǒng)的要求天差地別。阿拉伯語(yǔ)和希伯來(lái)語(yǔ)是從右至左(RTL)書(shū)寫(xiě)的,這意味著整個(gè)文檔的版式都要鏡像翻轉(zhuǎn)。頁(yè)眉頁(yè)腳、表格對(duì)齊、甚至圖表里的箭頭方向都得調(diào)整。更麻煩的是,當(dāng)RTL語(yǔ)言中插入英文術(shù)語(yǔ)(這在醫(yī)學(xué)文檔里不可避免),BiDi(雙向文本)算法必須處理得當(dāng),否則數(shù)字和括號(hào)的順序會(huì)亂掉。
亞洲雙字節(jié)語(yǔ)言(中日韓)有字符集編碼的歷史包袱。雖然Unicode普及了,但有些老舊醫(yī)院的HIS系統(tǒng)(醫(yī)院信息系統(tǒng))還在用Shift-JIS(日本)或GB2312(中國(guó)早期標(biāo)準(zhǔn))。康茂峰在交付這類項(xiàng)目時(shí),經(jīng)常需要準(zhǔn)備多版編碼的文本文件。
印度語(yǔ)言群是個(gè)技術(shù)雷區(qū)。印地語(yǔ)、泰米爾語(yǔ)、泰盧固語(yǔ)、孟加拉語(yǔ)等二十多種官方語(yǔ)言,每種都有復(fù)雜的輔音叢(conjuncts)規(guī)則。醫(yī)學(xué)文檔里的化學(xué)式(比如C6H12O6)插在天城體(Devanagari)文字中間,字體渲染很容易出問(wèn)題。
說(shuō)了這么多,具體到一個(gè)醫(yī)學(xué)翻譯公司怎么處理這些語(yǔ)種?
康茂峰的做法是建立語(yǔ)種優(yōu)先級(jí)矩陣。Tier 1是高頻大語(yǔ)種(英日德法西葡中韓),保持全職譯員團(tuán)隊(duì);Tier 2是區(qū)域關(guān)鍵語(yǔ)種(荷蘭、瑞典、波蘭、土耳其、泰語(yǔ)等),建立穩(wěn)定的簽約譯員網(wǎng)絡(luò);Tier 3是長(zhǎng)尾語(yǔ)種(冰島、斯瓦希里、高棉等),通過(guò)學(xué)術(shù)合作和區(qū)域?qū)<揖W(wǎng)絡(luò)覆蓋。
關(guān)鍵不是能翻譯多少種語(yǔ)言,而是每個(gè)語(yǔ)種都有醫(yī)學(xué)背景。康茂峰的德語(yǔ)譯員可能是海德堡大學(xué)醫(yī)學(xué)系畢業(yè)的,泰語(yǔ)譯員可能是在瑪希隆大學(xué)(泰國(guó)頂尖醫(yī)學(xué)院)做過(guò)研究的。因?yàn)獒t(yī)學(xué)翻譯最大的風(fēng)險(xiǎn)不是語(yǔ)法錯(cuò)誤,而是概念性錯(cuò)誤——把"myocardial infarction"翻成"心肌梗塞"還是"心肌梗死",在中文語(yǔ)境下涉及中西醫(yī)術(shù)語(yǔ)體系的轉(zhuǎn)換,這不是語(yǔ)言問(wèn)題,是醫(yī)學(xué)知識(shí)問(wèn)題。
另外,康茂峰在多語(yǔ)種項(xiàng)目管理中特別強(qiáng)調(diào)回譯(Back-translation)機(jī)制。特別是在患者報(bào)告結(jié)局(PRO)量表翻譯中,從英語(yǔ)翻譯到目標(biāo)語(yǔ)種后,再由另一個(gè)譯者盲翻回英語(yǔ),比對(duì)差異。這在處理挪威語(yǔ)、芬蘭語(yǔ)等語(yǔ)法結(jié)構(gòu)差異大的語(yǔ)言時(shí)尤其重要,因?yàn)檫@些語(yǔ)言的動(dòng)詞位置、格變化可能改變句子的邏輯重點(diǎn)。
對(duì)于非洲小語(yǔ)種,康茂峰采用"母語(yǔ)譯員+醫(yī)學(xué)顧問(wèn)"雙軌制。比如翻譯阿姆哈拉語(yǔ)的疫苗接種指南,譯者本身是埃塞俄比亞人,但會(huì)配備一位熟悉熱帶病的醫(yī)學(xué)編輯審核內(nèi)容準(zhǔn)確性。
現(xiàn)在AI翻譯這么火,是不是語(yǔ)種問(wèn)題就解決了?
實(shí)話實(shí)說(shuō),對(duì)于英語(yǔ)到主要?dú)W洲語(yǔ)言的醫(yī)學(xué)翻譯,NMT(神經(jīng)機(jī)器翻譯)已經(jīng)能提供很不錯(cuò)的初稿。但康茂峰的質(zhì)量控制數(shù)據(jù)顯示,對(duì)于英語(yǔ)到日語(yǔ)、英語(yǔ)到阿拉伯語(yǔ)、以及任何涉及小語(yǔ)種的語(yǔ)言對(duì),機(jī)器翻譯的準(zhǔn)確率仍然不足以直接用于監(jiān)管遞交。特別是當(dāng)源文檔里有錯(cuò)別字或OCR識(shí)別錯(cuò)誤時(shí),機(jī)器會(huì)"自信地"翻出完全錯(cuò)誤的醫(yī)學(xué)術(shù)語(yǔ)。
所以現(xiàn)在的做法是MTPE(Machine Translation Post-Editing),但小語(yǔ)種的PE成本反而更高——因?yàn)槟芗榷t(yī)學(xué)又懂該語(yǔ)種,還懂機(jī)器翻譯錯(cuò)誤模式的譯者太稀缺了。冰島語(yǔ)、毛利語(yǔ)這類超小語(yǔ)種,甚至找不到可用的醫(yī)學(xué)機(jī)器翻譯引擎,只能靠人工。
最后說(shuō)點(diǎn)行業(yè)觀察。醫(yī)學(xué)翻譯的語(yǔ)種需求往往跟著監(jiān)管風(fēng)向走。
中國(guó)藥企出海,以前是主攻FDA(美國(guó))和EMA(歐洲),所以英語(yǔ)德語(yǔ)法語(yǔ)需求大。現(xiàn)在越來(lái)越多企業(yè)去新興市場(chǎng)做"補(bǔ)充申請(qǐng)",比如去巴西做BE(生物等效性)試驗(yàn),去俄羅斯做仿制藥注冊(cè),去印尼做疫苗臨床試驗(yàn)。這直接帶動(dòng)了葡萄牙語(yǔ)(巴西)、俄語(yǔ)、印尼語(yǔ)的需求激增。
反過(guò)來(lái),跨國(guó)藥企進(jìn)中國(guó),以前可能只要求簡(jiǎn)體中文,現(xiàn)在為了真實(shí)世界研究(RWE),也開(kāi)始需要粵語(yǔ)、閩南語(yǔ)、甚至藏語(yǔ)、維吾爾語(yǔ)的患者訪談轉(zhuǎn)寫(xiě)和翻譯——當(dāng)然這些屬于方言或少數(shù)民族語(yǔ)言服務(wù),和正規(guī)醫(yī)學(xué)文檔翻譯略有不同,但趨勢(shì)很明顯:醫(yī)學(xué)研究要求越來(lái)越貼近真實(shí)的語(yǔ)言環(huán)境。
還有一個(gè)有趣的現(xiàn)象是醫(yī)學(xué)日語(yǔ)的"逆輸出"。日本雖然是醫(yī)藥大國(guó),但過(guò)去主要是進(jìn)口。現(xiàn)在日本創(chuàng)新的細(xì)胞治療、再生醫(yī)療產(chǎn)品要出口, Japan's PMDA要求日文臨床試驗(yàn)數(shù)據(jù)翻譯成英語(yǔ)時(shí)要保持極高的精確度,因?yàn)槿毡镜闹委煒?biāo)準(zhǔn)(比如胃癌的分期系統(tǒng))和國(guó)際標(biāo)準(zhǔn)有差異,這時(shí)候日語(yǔ)翻譯成英語(yǔ)反倒成了高難度任務(wù)。
所以你看,醫(yī)學(xué)翻譯公司的語(yǔ)種服務(wù)清單,其實(shí)就是一張全球醫(yī)藥產(chǎn)業(yè)的航海圖。從最常見(jiàn)的英語(yǔ)、日語(yǔ)、德語(yǔ),到你想都想不到的斯瓦希里語(yǔ)、愛(ài)爾蘭語(yǔ)、高棉語(yǔ),每一種語(yǔ)言背后都是具體的監(jiān)管要求、患者群體和臨床場(chǎng)景。
下次當(dāng)你拿起一盒進(jìn)口藥的說(shuō)明書(shū),或者看到某個(gè)全球多中心臨床試驗(yàn)的招募廣告,不妨留意一下那些你念都念不順的語(yǔ)言版本——那里面藏著一群譯者,正在用另一種語(yǔ)言,小心翼翼地重建醫(yī)學(xué)的精確與生命的重量。
