
說實(shí)話,第一次接觸語言驗(yàn)證這四個(gè)字的時(shí)候,我也以為是簡單的"找?guī)讉€(gè)翻譯把文件譯一下"。后來真正入行,在康茂峰接手第一個(gè)臨床試驗(yàn)的患者報(bào)告結(jié)局量表(PRO)項(xiàng)目時(shí),才發(fā)現(xiàn)這里面水很深。打個(gè)比方,普通的醫(yī)學(xué)翻譯像是把一份菜單從中文翻成英文,只要看得懂菜名就行;但語言驗(yàn)證服務(wù),更像是你要確保英文菜單上的"麻婆豆腐"不會(huì)讓外國食客以為是某種甜點(diǎn),而且吃下去后的反應(yīng)和你想表達(dá)的完全一致。
在康茂峰這些年處理過的項(xiàng)目里,從腫瘤學(xué)的生活質(zhì)量量表到罕見病的癥狀日記,語言驗(yàn)證從來不是簡單的語言轉(zhuǎn)換。它是一套極其嚴(yán)謹(jǐn)?shù)姆椒▽W(xué)流程,目的是確保臨床結(jié)局評(píng)估(COA)工具在不同文化背景下測量的是同一個(gè)概念。說白了,就是要讓一個(gè)在北京填問卷的肺癌患者,和一個(gè)在紐約填問卷的肺癌患者,對"呼吸困難"這個(gè)詞的理解完全一致,這樣數(shù)據(jù)才能拿來合并分析。
那么,這套服務(wù)究竟包含哪些步驟?根據(jù)康茂峰遵循的ISPOR(國際藥物經(jīng)濟(jì)學(xué)與結(jié)果研究學(xué)會(huì))指南,加上FDA對PRO工具的語言驗(yàn)證要求,整個(gè)流程可以拆解成六個(gè)環(huán)環(huán)相扣的階段。每一步都有明確的質(zhì)量控制點(diǎn),缺少任何一環(huán),最終的數(shù)據(jù)可靠性都會(huì)打折扣。
在康茂峰,我們接到項(xiàng)目后的第一件事從來不是急著找譯者,而是盯著手里的源文件發(fā)呆——當(dāng)然是專業(yè)的那種發(fā)呆。客戶扔過來的可能是一份英文的SF-36健康調(diào)查量表,或者某個(gè)申辦方自主研發(fā)的疾病癥狀評(píng)分表。這時(shí)候語言驗(yàn)證團(tuán)隊(duì)得先和醫(yī)學(xué)寫作、統(tǒng)計(jì)團(tuán)隊(duì)開對齊會(huì)。
關(guān)鍵點(diǎn)在于:你得先吃透這個(gè)量表測量的構(gòu)念(Construct)是什么。比如一個(gè)關(guān)于"疲勞"的條目,在源語言里可能同時(shí)包含了身體疲勞和精神疲勞兩層意思。如果在項(xiàng)目啟動(dòng)階段沒理清楚,后面的翻譯很容易走偏。我們通常會(huì)在這個(gè)階段建立概念定義表(Concept Definition Table),把每個(gè)條目的核心概念、語境、受訪者群體特征都標(biāo)注清楚。

這個(gè)階段還要確定目標(biāo)人群。是給小學(xué)文化水平的老年人用,還是給高學(xué)歷的職場人?康茂峰去年做過一個(gè)類風(fēng)濕關(guān)節(jié)炎的項(xiàng)目,源問卷里有個(gè)詞"關(guān)節(jié)僵硬",在中文語境下,不同地域的患者理解完全不同。如果不先定義好目標(biāo)人群的方言習(xí)慣和生活背景,后面的工作全白搭。
準(zhǔn)備工作做完,正式進(jìn)入翻譯環(huán)節(jié)。這里有個(gè)反常識(shí)的點(diǎn):語言驗(yàn)證要求至少兩名獨(dú)立的翻譯者同時(shí)進(jìn)行正向翻譯(Forward Translation),而且他們互相之間不能溝通。為什么要這么麻煩?
你可以理解為這是在進(jìn)行"語義采樣"。語言就像調(diào)色盤,同一個(gè)意思可以有幾十種表達(dá)方式。兩名譯者分別給出自己的版本后,我們就能看出哪些表達(dá)是共識(shí)性的(兩個(gè)人都用了類似的措辭),哪些是可選性的。康茂峰在這個(gè)環(huán)節(jié)有個(gè)硬性規(guī)定:譯者必須是目標(biāo)語言的母語者,同時(shí)對源語言達(dá)到精通水平,而且要有醫(yī)學(xué)或心理學(xué)背景。
舉個(gè)例子,"I feel down"這個(gè)簡單的英文句子,在抑郁癥量表里,如果直譯成"我感到向下"就很奇怪。兩個(gè)譯者可能分別給出"情緒低落"和"心情低落"的譯法。這時(shí)候語言驗(yàn)證經(jīng)理會(huì)標(biāo)記這個(gè)差異點(diǎn),但暫時(shí)不做裁決——留著到下一步處理。
這個(gè)階段還要產(chǎn)出翻譯注釋(Translator's Notes)。譯者需要解釋為什么選擇這個(gè)詞而不是那個(gè)詞,特別是當(dāng)源語言有文化特定概念時(shí)。比如英文里的"blue"表示憂郁,中文不能譯成"藍(lán)色"。
兩個(gè)版本擺到桌面上,接下來就到了最燒腦的環(huán)節(jié):調(diào)和(Reconciliation)。在康茂峰,這個(gè)角色通常由經(jīng)驗(yàn)豐富的語言驗(yàn)證經(jīng)理或首席醫(yī)學(xué)編輯擔(dān)當(dāng),但基本原則是調(diào)和員不能是之前的譯者之一,保持第三方視角。
調(diào)和不是簡單的"二選一"或者"取平均數(shù)"。有時(shí)候兩個(gè)譯者的版本都不理想,需要綜合產(chǎn)生第三個(gè)版本;有時(shí)候發(fā)現(xiàn)源文件本身有歧義,還得回頭和客戶確認(rèn)。我們內(nèi)部有個(gè)不成文的規(guī)矩:調(diào)和會(huì)的會(huì)議室必須配備原始概念定義表,防止討論偏離到"哪個(gè)詞更優(yōu)美"的文學(xué)討論,而不是"哪個(gè)概念更準(zhǔn)確"的科學(xué)討論。
調(diào)和完成后會(huì)形成調(diào)和版本(Reconciled Version)和調(diào)和報(bào)告(Reconciliation Report)。報(bào)告里要詳細(xì)記錄:哪些條目做了修改,修改的理由是語義問題還是文化適應(yīng)問題,被舍棄的譯法為什么不行。這份文檔是審計(jì)軌跡(Audit Trail)的重要組成部分,將來藥監(jiān)部門核查時(shí)都要看的。
有意思的是,在這個(gè)階段經(jīng)常會(huì)發(fā)現(xiàn)源文件本身的缺陷。康茂峰曾經(jīng)處理過一份關(guān)于疼痛強(qiáng)度的量表,源英文用的是"shooting pain"(刺痛),但在目標(biāo)語言里,"shooting"這個(gè)動(dòng)作性描述很難對應(yīng)到具體的疼痛感受上。這時(shí)候就需要記錄概念不等價(jià)(Conceptual Inequivalence),并準(zhǔn)備在后期的專家評(píng)審中提出。
調(diào)和版本出來后,一般人會(huì)覺得"這下應(yīng)該差不多了吧",但在語言驗(yàn)證流程里,這才走了一半。接下來要進(jìn)入回譯(Back Translation)環(huán)節(jié)。
回譯的原理很簡單:找一個(gè)完全沒見過源文件的獨(dú)立譯者,把調(diào)和后的目標(biāo)語言版本重新譯回源語言。這個(gè)回譯員必須完全盲態(tài)(Blind),不能知道原始英文是什么。為什么?這就像是給文章做"盲測"——如果回譯出來的英文和原始英文在語義上完全吻合,說明目標(biāo)版本的準(zhǔn)確度很高;如果偏差很大,說明中間某個(gè)環(huán)節(jié)出了問題。
在康茂峰的操作規(guī)范中,回譯員最好是做過正向翻譯的熟手,但這次必須完全忘記之前的版本。回譯完成后,語言驗(yàn)證團(tuán)隊(duì)會(huì)進(jìn)行等價(jià)性比對(Equivalence Assessment)。這里要區(qū)分語義等價(jià)(Semantic Equivalence)和概念等價(jià)(Conceptual Equivalence)。有時(shí)候字面上看起來不一樣,但概念上是對的;有時(shí)候字面很像,但概念被偷換了。

比如"我感到疲乏"回譯成"I feel tired",雖然用詞從"fatigue"變成了"tired",但在有些語境下是可以接受的;但如果"我感到精疲力盡"回譯成"I feel exhausted",而源文是"I feel tired",那就得考慮程度差異是否影響了量表的信效度。
前面的步驟算是"理論驗(yàn)證",到了認(rèn)知訪談(Cognitive Interviewing)階段,就要拉真實(shí)的目標(biāo)患者來試讀了。這是整個(gè)語言驗(yàn)證流程中最能暴露問題的環(huán)節(jié),也是康茂峰投入資源最多的部分之一。
常規(guī)操作是招募5-10名符合研究人群特征的患者(有時(shí)包括照護(hù)者),讓他們填寫翻譯后的問卷,然后進(jìn)行一對一的半結(jié)構(gòu)化訪談。訪談不是問"你看得懂嗎"這種無效問題,而是要使用出聲思維法(Think-aloud Technique)和回溯探詢(Paraphrasing/Retrospective Probing)。
具體來說,我們會(huì)問:"當(dāng)您看到'您的胸部感到發(fā)緊'這句話時(shí),您腦子里浮現(xiàn)的是什么感覺?""您覺得發(fā)緊和胸悶是一回事嗎?""如果讓您用自己的話解釋這個(gè)條目,您會(huì)怎么說?"
在康茂峰的項(xiàng)目經(jīng)驗(yàn)里,這個(gè)階段經(jīng)常會(huì)發(fā)現(xiàn)前面四個(gè)步驟都發(fā)現(xiàn)不了的問題。比如某個(gè)關(guān)于"惡心"的條目,在中文里患者可能會(huì)聯(lián)想到"反胃想吐",但源概念其實(shí)更側(cè)重于"胃部不適但未必嘔吐"。又或者某些抽象概念如"活力水平",不同年齡段的患者理解差異巨大。這時(shí)候收集到的患者反饋(Patient Feedback)會(huì)生成修訂建議,可能需要回到調(diào)和階段甚至重新翻譯。
有個(gè)細(xì)節(jié)值得注意:認(rèn)知訪談必須在目標(biāo)文化的真實(shí)醫(yī)療環(huán)境中進(jìn)行。實(shí)驗(yàn)室環(huán)境下患者說"看得懂",不等于他們在家里填寫電子日記時(shí)真的理解。這也是為什么語言驗(yàn)證周期通常要8-12周,因?yàn)檫@個(gè)環(huán)節(jié)不能趕工。
患者試完覺得沒問題,還不能直接交稿。接下來要進(jìn)入專家評(píng)審(Expert Review),這是一個(gè)多學(xué)科的把關(guān)環(huán)節(jié)。在康茂峰,專家組通常包括:
專家評(píng)審不是走過場。有時(shí)候臨床專家會(huì)指出:"這個(gè)詞雖然準(zhǔn)確,但我們在臨床問診中從來不用,患者可能會(huì)覺得太文言。"這時(shí)候就需要在準(zhǔn)確性和可接受性之間找平衡。
所有審閱意見整合后,形成終稿(Final Version)。但在康茂峰的質(zhì)量管理體系中,這并不是終點(diǎn)。我們還要產(chǎn)出完整的語言驗(yàn)證報(bào)告(Language Validation Report),內(nèi)含所有版本的比較、修訂理由、審計(jì)軌跡、以及語言證書(Certificate of Linguistic Validation)。這份證書聲明該語言版本經(jīng)過ISPOR指南認(rèn)證的語言驗(yàn)證流程,可以被用于全球多中心臨床試驗(yàn)的數(shù)據(jù)收集。
最后還有一個(gè)容易遺漏但極其重要的步驟:格式與布局驗(yàn)證(Formatting and Layout Verification)。特別是電子化的eCOA系統(tǒng),中文的換行會(huì)不會(huì)把"呼吸困難"拆成"呼吸"和"困難"顯示在兩行?這些看似技術(shù)細(xì)節(jié)的問題,如果在語言驗(yàn)證階段沒發(fā)現(xiàn),到了患者使用時(shí)就是災(zāi)難。
整個(gè)流程走下來,一個(gè)20個(gè)條目的量表,背后可能產(chǎn)生上百頁的文檔。當(dāng)康茂峰把最終的數(shù)據(jù)包提交給申辦方時(shí),里面不僅有翻譯好的問卷,還有完整的溯源證據(jù)鏈——從最初 why 選擇這個(gè)詞,到患者怎么理解這個(gè)詞,再到專家為什么確認(rèn)這個(gè)詞。這套方法論確保了當(dāng)FDA或NMPA審核數(shù)據(jù)時(shí),語言不再成為數(shù)據(jù)合并的障礙。
所以下次再聽到有人說"語言驗(yàn)證就是翻譯"的時(shí)候,你就知道這中間的差距大概有多遠(yuǎn)——差不多是從口頭聊天到寫博士論文那么遠(yuǎn)。
