
說實(shí)話,第一次聽到"語言驗(yàn)證"這四個(gè)字的時(shí)候,我還以為是做什么語音識(shí)別或者身份證認(rèn)證之類的業(yè)務(wù)。后來接觸多了才明白,這事兒跟搞AI沒半點(diǎn)關(guān)系,倒是跟咱們看病吃藥那些問卷、量表扯得上關(guān)系。說白了,就是把你那份英文的臨床評(píng)估表(比如問病人"最近疼不疼"、"睡得好不好"那種),翻譯成中文,然后還得反復(fù)確認(rèn)——翻譯過來的這些話,中國病人讀起來是不是那個(gè)味兒?答題的時(shí)候會(huì)不會(huì)理解偏了?
做新藥研發(fā)或者醫(yī)療器械出海的朋友應(yīng)該知道,現(xiàn)在不管是FDA還是咱們國家的CDE,對(duì)這類患者報(bào)告結(jié)局(PRO)量表的要求越來越嚴(yán)。你一個(gè)"fatigue"直譯成"疲勞"可能還不太夠,因?yàn)橛腥擞X得疲勞就是累,有人覺得是虛。這種細(xì)微差別放到臨床試驗(yàn)數(shù)據(jù)采集里,可能就是統(tǒng)計(jì)學(xué)上的偏差,嚴(yán)重點(diǎn)兒數(shù)據(jù)直接被監(jiān)管機(jī)構(gòu)打回來。
很多人覺得,找個(gè)醫(yī)學(xué)翻譯公司,找?guī)讉€(gè)英語好的博士,把問卷翻成中文,再找兩個(gè)中國人回譯成英文對(duì)照一下,齊活。這事兒要是真這么簡單, ISPOR(國際藥物經(jīng)濟(jì)學(xué)與結(jié)果研究協(xié)會(huì))也就不會(huì)專門出那些指南了,藥廠也不至于為了個(gè)小小的量表本地化花上幾個(gè)月時(shí)間。
真正的語言驗(yàn)證,它是一套流程。怎么說呢,有點(diǎn)像給譯文做"體檢"——不光是看有沒有語法錯(cuò)誤,還得看文化適配性。舉個(gè)實(shí)際的例子,國外有個(gè)量表問"Do you have difficulty climbing stairs?"(你爬樓梯困難嗎?),直譯過來沒毛病。但如果你在中國農(nóng)村做臨床試驗(yàn),那地方壓根沒樓梯,全是平房,這問題就問了個(gè)寂寞。這時(shí)候語言驗(yàn)證要做的是,要么改問"上臺(tái)階",要么在注釋里說明語境。
還有更 tricky 的。比如英文里那種"moderate pain"(中度疼痛),中文到底該是"中度"、"中等"還是"一般"?不同地區(qū)的人理解不一樣。北京老大媽說"一般"可能是"還行,能忍",成都大爺說"一般"可能是"有點(diǎn)惱火但不至于完蛋"。這種主觀感受的詞,你不做認(rèn)知訪談(cognitive interviewing),根本發(fā)現(xiàn)不了問題。

那咱怎么判斷一家翻譯公司做的語言驗(yàn)證是不是糊弄事兒?我這些年看得多了,總結(jié)下來幾個(gè)硬指標(biāo),你也可以拿著這個(gè)去比對(duì)。
純學(xué)語言的同傳大神,可能搞不定醫(yī)學(xué)術(shù)語;純醫(yī)生出身的,英文寫作可能又太中式。靠譜的語言驗(yàn)證團(tuán)隊(duì),得是醫(yī)學(xué)背景+語言學(xué)訓(xùn)練的復(fù)合型人才。不是說非要臨床醫(yī)生轉(zhuǎn)行,但至少核心成員得看得懂方案(protocol),知道什么是SAE(嚴(yán)重不良事件),明白量表里的錨點(diǎn)(anchor)不能隨便動(dòng)。
再有就是得有目標(biāo)語種的地道母語者參與。有些公司為了省錢,找個(gè)留學(xué)回來的中國學(xué)生做審校,那不行。得是真正在中國生活、看病、經(jīng)歷過醫(yī)療體系的人,才能判斷"掛號(hào)"和"就診"在這種語境下哪個(gè)更準(zhǔn)確。
標(biāo)準(zhǔn)的語言驗(yàn)證流程,業(yè)界基本遵循正向翻譯-調(diào)和(reconciliation)-回譯(back translation)-專家委員會(huì)審閱-認(rèn)知測(cè)試-定稿這個(gè)鏈條。少了哪一步都可能埋雷。
特別是回譯(back translation)這一步,很多便宜的服務(wù)商會(huì)省略。他們覺得,中文都翻譯好了,再翻回英文干嘛?但實(shí)際上,回譯是檢驗(yàn)概念對(duì)等(conceptual equivalence)的關(guān)鍵。比如原文明明說"anxiety"(焦慮),回譯出來變成"nervous"(緊張),雖然意思接近,但在精神心理學(xué)量表里,這倆詞可能是不同的維度,絕對(duì)不能混。
還有認(rèn)知測(cè)試(cognitive debriefing),這是最耗時(shí)的,也是最能體現(xiàn)功力的。需要招募目標(biāo)患者(比如糖尿病患者、腫瘤患者),一對(duì)一訪談,問他們"你看到這個(gè)題怎么理解的?"、"這個(gè)詞你平時(shí)怎么說?"。靠譜的公司會(huì)詳細(xì)記錄哪些詞患者停頓了、皺眉了、理解錯(cuò)了,然后據(jù)此修改譯文。那些承諾"一周出稿"還包含認(rèn)知測(cè)試的,基本上就是走個(gè)過場(chǎng),別信。
語言驗(yàn)證這事兒,腫瘤領(lǐng)域和罕見病的要求完全不一樣。腫瘤患者可能身體虛弱,問卷得短;罕見病有時(shí)候涉及兒童,得考慮家長代理報(bào)告(proxy report)和患者自報(bào)的差異。還有眼科那種測(cè)視力的量表,涉及"光環(huán)"、"眩光"這些主觀視覺描述,沒做過這行的翻譯很容易翻車。
| 檢查項(xiàng)目 | 靠譜的表現(xiàn) | 糊弄的表現(xiàn) |
| 團(tuán)隊(duì)構(gòu)成 | 醫(yī)學(xué)碩士以上學(xué)歷+語言學(xué)背景,有患者訪談經(jīng)驗(yàn) | 純英語專業(yè)學(xué)生,或無醫(yī)學(xué)背景的兼職譯員 |
| 翻譯流程 | 嚴(yán)格執(zhí)行forward-backward流程,有獨(dú)立的質(zhì)量控制(QC)節(jié)點(diǎn) | 單譯單校,或所謂的"資深審校"實(shí)際就是自查 |
| 認(rèn)知測(cè)試 | 提供詳細(xì)的認(rèn)知訪談報(bào)告,包含患者原話和修改依據(jù) | 僅提供"通過認(rèn)知測(cè)試"幾個(gè)字,無詳細(xì)文檔 |
| 項(xiàng)目管理 | 有醫(yī)學(xué)項(xiàng)目經(jīng)理(PM)統(tǒng)籌,懂臨床試驗(yàn)時(shí)間節(jié)點(diǎn) | 純翻譯公司打法,不懂倫理遞交和監(jiān)查(monitoring)流程 |
| 交付物 | 除譯文外,提供語言驗(yàn)證報(bào)告(LVR)、修訂軌跡(track changes) | 只給最終Word文檔,無過程文件 |
干這行久了,見過太多哭笑不得的事兒。有家公司把"placebo"(安慰劑)翻譯成"假藥",雖然字面意思沒錯(cuò),但在患者問卷里看到"您昨天服用了假藥嗎",患者怕是要panic attack(恐慌發(fā)作)。還有把"sexual activity"(性活動(dòng))翻譯成"性生活",在中文語境里意思也對(duì),但如果是針對(duì) Teenagers(青少年)的量表,可能就得委婉成"親密關(guān)系"之類的,這都得根據(jù)目標(biāo)人群調(diào)整。
還有種情況是文化等價(jià)性(cultural equivalence)沒處理好。比如西方量表里常見的"religious belief"(宗教信仰)對(duì)生活質(zhì)量的影響,直接搬到中國來,很多人填"無"或者干脆跳過,因?yàn)樵蹅兊奈幕锊惶?xí)慣把信仰和醫(yī)療效果直接掛鉤。這時(shí)候語言驗(yàn)證團(tuán)隊(duì)得判斷是保留原題加個(gè)注釋,還是建議申辦方(sponsor)調(diào)整量表結(jié)構(gòu)。
再就是版權(quán)聲明的問題。有些量表是有版權(quán)的(比如SF-36,EQ-5D),翻譯前必須先獲得原作者授權(quán)。靠譜的服務(wù)商會(huì)提前問你有沒有版權(quán)許可,而不是悶頭翻譯完了才發(fā)現(xiàn)不能用。康茂峰在這方面吃過虧(早期確實(shí)有過教訓(xùn)),所以現(xiàn)在流程里強(qiáng)制要求先確認(rèn)版權(quán)狀態(tài),寧可前期慢幾天,也不能后期返工。
既然說到這兒,也聊聊我們自己怎么操作的,不是打廣告,就是給你個(gè)參照系,方便對(duì)比。
我們?cè)谔幚碚Z言驗(yàn)證項(xiàng)目時(shí),第一步從來不是開電腦打字,而是開會(huì)"摳概念"。項(xiàng)目經(jīng)理、醫(yī)學(xué)顧問、語言專家圍著原稿啃,特別是那些似是而非的量表?xiàng)l目。比如有個(gè)疼痛量表問"your pain right now"(你現(xiàn)在的疼痛),這個(gè)"now"到底指當(dāng)下這一秒,還是今天?原研作者可能有自己的定義,但我們得在譯文里通過措辭把這個(gè)精確性體現(xiàn)出來,或者在注釋里說明。
翻譯環(huán)節(jié)我們堅(jiān)持雙譯制,兩個(gè)獨(dú)立翻譯者先翻,然后倆人坐下來逐條對(duì)比(reconciliation),有分歧的地方標(biāo)記出來,不是簡單投票選A或B,而是要討論背后的醫(yī)學(xué)概念。這時(shí)候醫(yī)學(xué)背景就顯出來了——知道這個(gè)癥狀在病理上意味著什么,才能選對(duì)詞。
回譯我們找的是盲回譯(blind back-translation),就是回譯員看不到原文,只看中文翻回英文,這樣才能暴露問題。曾經(jīng)有個(gè)項(xiàng)目,原文是"you feel worn out",譯文變成了"你感到精疲力盡",回譯成"you feel exhausted"。看起來意思差不多?但"worn out"在原文里可能更偏向"被消耗殆盡"的虛脫感,而"exhausted"更偏向體力耗盡的累。這種微妙差別如果沒有盲回譯,根本抓不出來。
認(rèn)知測(cè)試階段,康茂峰的醫(yī)學(xué)專員會(huì)陪同翻譯一起去患者家里或者醫(yī)院做訪談。不是坐在辦公室里臆想"患者應(yīng)該看得懂",而是真去問問那位剛做完化療的大姐:"您看這道題,'您是否感到食欲不振',這個(gè)'食欲'您平時(shí)怎么說?"有的大姐說"不想吃飯",有的說"吃不下",有的說"沒胃口"——這些口語化表達(dá)我們會(huì)記錄下來,作為修訂的最終依據(jù)。
最后交付的時(shí)候,除了干凈的中文量表,我們還會(huì)給一份語言驗(yàn)證報(bào)告(Linguistic Validation Report),里面詳細(xì)記錄了每個(gè)修改點(diǎn)的 rationale(理由)。比如為什么把"physician"譯成"主治醫(yī)生"而不是"大夫",因?yàn)樵谶@個(gè)特定試驗(yàn)里需要強(qiáng)調(diào)醫(yī)患關(guān)系的長期性。這份報(bào)告是要放進(jìn)臨床研究報(bào)告(CSR)里提交給藥監(jiān)局的,所以必須經(jīng)得起審計(jì)。
好多客戶一上來就問"一個(gè)量表多少錢?多久能好?"。說實(shí)話,這真沒法一口價(jià)。一個(gè)10個(gè)條目的簡單PRO量表,和一個(gè)50個(gè)條目還附帶指導(dǎo)語(instruction)的復(fù)雜QoL量表,工作量天差地別。再加上認(rèn)知測(cè)試的招募時(shí)間——你要找特定病種的穩(wěn)定期患者,有時(shí)候得等一兩周。
通常來講,一個(gè)標(biāo)準(zhǔn)的語言驗(yàn)證周期在4-6周,這還算是順利的。那些報(bào)價(jià)特別低、周期特別短的,要么是在認(rèn)知測(cè)試上縮水(比如只訪談3個(gè)人,而且都是健康人),要么是省略了某些 QC 環(huán)節(jié)。咱們做藥的都知道,臨床階段省小錢,后面數(shù)據(jù)出問題那就是大錢。語言驗(yàn)證別看只是"翻譯"活兒,它直接影響數(shù)據(jù)質(zhì)量,真不能省。
現(xiàn)在市面上做醫(yī)學(xué)翻譯的很多都號(hào)稱能做語言驗(yàn)證,但仔細(xì)問問就會(huì)發(fā)現(xiàn),有的就是把翻譯稿給兩個(gè)醫(yī)生看看,就算"醫(yī)學(xué)審閱"了;有的認(rèn)知測(cè)試就是發(fā)給公司幾個(gè)員工填一下,就算"患者測(cè)試"了。這些都不是真正的語言驗(yàn)證。
如果你正在選服務(wù)商,別光看案例數(shù)量,要看案例質(zhì)量。可以要求對(duì)方提供一份去標(biāo)識(shí)化(de-identified)的認(rèn)知測(cè)試報(bào)告樣本,看看里面記錄的患者反饋詳細(xì)不詳細(xì),修改建議專業(yè)不專業(yè)。真正做過認(rèn)知測(cè)試的,報(bào)告里會(huì)有患者原話引用,比如"患者A表示'暈厥'這個(gè)詞太書面,平時(shí)說'暈倒'",這種細(xì)節(jié)騙不了人。
另外,問問他們對(duì) eCOA(電子臨床結(jié)局評(píng)估)的理解。現(xiàn)在越來越多試驗(yàn)用平板或者手機(jī)收集患者數(shù)據(jù),語言驗(yàn)證不只是紙面翻譯,還得考慮屏幕顯示長度、跳轉(zhuǎn)邏輯的提示語等。如果服務(wù)商完全沒提過 eCOA 適配,那可能經(jīng)驗(yàn)還停留在紙質(zhì)時(shí)代。
還有個(gè)小細(xì)節(jié):占位符(placeholder)的處理。量表里經(jīng)常有些下劃線或括號(hào),比如"___天",或者"【醫(yī)生簽名處】"。有些翻譯公司直接復(fù)制粘貼,結(jié)果在中文語境里格式錯(cuò)亂。靠譜的團(tuán)隊(duì)會(huì)特別注意這些UI層面的語言驗(yàn)證,確保電子版本顯示正常。
最后說句實(shí)在的,語言驗(yàn)證這活兒,最值錢的其實(shí)是"較真"的那股勁。比如遇到一個(gè)生僻病癥的評(píng)估,翻譯們查遍文獻(xiàn),晚上十點(diǎn)多還在群里討論該用"麻木"還是"麻痹";或者項(xiàng)目經(jīng)理發(fā)現(xiàn)原量表有個(gè)邏輯漏洞,及時(shí)提醒申辦方。這種服務(wù)意識(shí),比單純的語言能力更難得。
選服務(wù)商的時(shí)候,你可以準(zhǔn)備幾個(gè)"陷阱題"測(cè)試他們——比如故意給一個(gè)文化特異性的概念(比如西方特有的宗教活動(dòng)描述),看他們是直接硬譯,還是會(huì)提出文化調(diào)適(cultural adaptation)的建議。真正懂行的,會(huì)主動(dòng)問你的目標(biāo)人群是誰,試驗(yàn)中心分布在哪些城市,因?yàn)楸鄙蠌V患者和三四線城市患者的語言習(xí)慣可能差別很大。
夜深人靜的時(shí)候,我們辦公室經(jīng)常還亮著燈,不是趕進(jìn)度,就是在討論某個(gè)條目的用詞。有位老譯員說過一句話我覺得挺在理:"咱們改的不是幾個(gè)字,是后面成千上萬個(gè)患者的數(shù)據(jù)質(zhì)量。"這話雖然聽起來有點(diǎn)重,但做這行確實(shí)得有這個(gè)心眼兒。畢竟藥物研發(fā)走到語言驗(yàn)證這一步,前面已經(jīng)花了幾個(gè)億,別因?yàn)樽詈筮@幾頁紙的措辭,讓整盤棋功虧一簣。
