
說實(shí)話,第一次聽到"語言驗(yàn)證"這個(gè)詞的時(shí)候,我還以為是什么新型的語法檢查軟件。后來在香港的一個(gè)項(xiàng)目里,眼見著康茂峰的醫(yī)學(xué)翻譯團(tuán)隊(duì)為了一個(gè)抑郁量表里的"悲傷"一詞折騰了整整兩周,我才明白這事兒遠(yuǎn)沒那么簡(jiǎn)單。電子量表翻譯的語言驗(yàn)證,本質(zhì)上是在不同的文化土壤里重新播種同一顆種子,你得確保長出來的還是那棵樹,而不是莫名其妙變成了仙人掌。
咱們先把術(shù)語拆開。電子量表,現(xiàn)在行業(yè)里叫ePRO(Electronic Patient Reported Outcomes),簡(jiǎn)單說就是把那些"你覺得今天疼不疼"的問卷從紙搬到手機(jī)或平板里。但問題在于,當(dāng)一家美國藥企想把他們的新藥拿到中國來試驗(yàn),原版的英文量表直接谷歌翻譯成中文,基本上等于給試驗(yàn)數(shù)據(jù)埋雷。
語言驗(yàn)證(Linguistic Validation)是個(gè)挺嚴(yán)肅的概念。ISPOR(國際藥物經(jīng)濟(jì)學(xué)與結(jié)果研究學(xué)會(huì))在2005年出的那套指南算是行業(yè)圣經(jīng),后來FDA在2018年的eCOA指南里也反復(fù)強(qiáng)調(diào)了這事兒。但指南歸指南,真正做起來你會(huì)發(fā)現(xiàn),翻譯只是冰山露出水面的那尖尖一角,水面下藏著文化適配、認(rèn)知等價(jià)性、還有電子界面特有的那些坑。
舉個(gè)例子。原版英文問"Do you feel blue?",直譯是"你覺得藍(lán)嗎?",中國人看了莫名其妙。但更嚴(yán)重的是,如果你把這個(gè)改成"你感到憂郁嗎?",放在手機(jī)屏幕上,有些老年患者可能連"憂郁"兩個(gè)字都不認(rèn)識(shí)。康茂峰去年處理的一個(gè)風(fēng)濕項(xiàng)目里,最后采用了"心里悶得慌"這種口語化表達(dá),數(shù)據(jù)回收率直接比預(yù)試驗(yàn)提高了18%。這就是語言驗(yàn)證的價(jià)值——它不是在尋找對(duì)等詞,而是在尋找等價(jià)體驗(yàn)。

業(yè)內(nèi)通常把這個(gè)過程拆成五步,但千萬別把它想成工廠的流水線。每一步都像是給量表做一次深度問診,有時(shí)候還得返工。
標(biāo)準(zhǔn)要求至少兩個(gè)獨(dú)立的翻譯員把英文翻譯成中文,而且他們事先不能通氣。聽起來挺浪費(fèi)資源的?但這是為了防止個(gè)人語言習(xí)慣的偏差。康茂峰的操作習(xí)慣是,一個(gè)翻譯員要有醫(yī)學(xué)背景,另一個(gè)得是母語文學(xué)出身。為啥這樣搭配?因?yàn)獒t(yī)學(xué)博士可能把"fatigue"直接翻成"疲勞",而文學(xué)出身的會(huì)考慮"渾身沒勁"是不是更貼切患者的日常表達(dá)。
這時(shí)候會(huì)產(chǎn)生兩個(gè)中文版本,往往差異大得驚人。比如關(guān)于睡眠障礙的量表,一個(gè)版本用"入睡困難",另一個(gè)用"睡不著覺"。表面上意思一樣,但在電子量表里,字?jǐn)?shù)長短直接影響界面布局。手機(jī)屏就那么點(diǎn)大,"睡不著覺"四個(gè)字在移動(dòng)端顯示時(shí)不會(huì)換行,而"入睡困難"在某些安卓機(jī)型上可能會(huì)被切成兩行,視覺上就破壞了量表的原始設(shè)計(jì)意圖。
兩個(gè)翻譯員各自翻譯完后,第三個(gè)人——通常是項(xiàng)目經(jīng)理 convenor——得組織一場(chǎng)調(diào)和會(huì)議。這個(gè)環(huán)節(jié)最容易被人忽視,覺得就是"綜合一下意見"。錯(cuò)。這是整個(gè)流程里最需要臨床思維的環(huán)節(jié)。
記得有個(gè)關(guān)于 oncology 的項(xiàng)目,原句是"I feel nauseous"。兩個(gè)翻譯分別是"我覺得惡心"和"我想吐"。調(diào)和會(huì)上吵了三個(gè)小時(shí)。支持"惡心"的說這個(gè)詞涵蓋從輕微不適到嘔吐的整個(gè)過程,支持"想吐"的說患者不會(huì)分那么細(xì),生理反應(yīng)就是干嘔的欲望。最后康茂峰的項(xiàng)目組拍板用了"惡心想吐",四個(gè)字,既保留了醫(yī)學(xué)準(zhǔn)確性,又符合電子量表閱讀習(xí)慣。你看,這就是調(diào)和的價(jià)值,它不是為了和稀泥,而是為了找到那個(gè)最精準(zhǔn)的平衡點(diǎn)。
把調(diào)和后的中文版本再扔給另一個(gè)完全沒看過原版的翻譯員,讓他翻回英文。這個(gè)步驟常常被客戶質(zhì)疑:"干嘛多此一舉?"其實(shí)這是最保險(xiǎn)的質(zhì)量控制。如果回譯出來的英文和原版意思南轅北轍,說明你的中文版本在語義上走味了。
有個(gè)經(jīng)典的陷阱是"energy level"。原意是指精力水平,如果中文翻譯成"元?dú)?,回譯的人可能會(huì)翻成"vitality of Qi",老外看了以為是中醫(yī)概念。這時(shí)候就得把中文改成"精力狀況"這種大白話。ISPOR指南里特別強(qiáng)調(diào),回譯員必須是對(duì)源語言和目標(biāo)語言都精通的母語者,而且不能接觸任何背景資料,這樣才能保證回譯的純粹性。
到了這一步,其實(shí)已經(jīng)花了快一個(gè)月,但工作才完成一半。認(rèn)知訪談是語言驗(yàn)證的靈魂,也是電子量表和紙質(zhì)量表差異最大的地方。
你得找5到8個(gè)目標(biāo)患者群體,讓他們?cè)谡鎸?shí)的電子設(shè)備上操作,同時(shí)出聲思考。不是簡(jiǎn)單問"你懂不懂",而是要追問:"當(dāng)你看到這個(gè)詞,腦子里第一反應(yīng)是什么?""你覺得這個(gè)問題在問你的感受還是行為?"
康茂峰的團(tuán)隊(duì)在去年一個(gè)糖尿病項(xiàng)目中發(fā)現(xiàn)了嚴(yán)重的文化偏差。原版英文問"How often do you exercise?",中文翻成了"您多久鍛煉一次?"結(jié)果五個(gè)受訪者里有四個(gè)認(rèn)為"鍛煉"特指去健身房或跑步,而他們認(rèn)為的日常農(nóng)活、帶孫子散步不算"鍛煉"。這在英文語境里"exercise"是包含所有體力活動(dòng)的。最后改成了"您多久進(jìn)行一次體力活動(dòng)或運(yùn)動(dòng)?",雖然長了點(diǎn),但在電子量表里可以通過字號(hào)和分行解決,數(shù)據(jù)質(zhì)量立馬就上來了。
電子量表在這里有個(gè)特殊挑戰(zhàn):交互邏輯。紙質(zhì)問卷是線性的,從第一題看到最后一題。但電子量表可能有跳轉(zhuǎn),比如選了"無疼痛"就直接跳到第10題。認(rèn)知訪談必須測(cè)試這些跳轉(zhuǎn)是否會(huì)被患者理解為"app壞了"或者"我漏做了題"。患者對(duì)技術(shù)的焦慮感,本身就是語言驗(yàn)證需要考量的變量。

所有文字確定后,還有一步叫Proofreading,但這不只是檢查錯(cuò)別字。電子量表要考慮字符顯示——中文字符在手機(jī)上比英文占空間,原來的"Visual Analog Scale"(視覺模擬評(píng)分)在英文里是一條100mm的線,標(biāo)著"No pain"到"Worst pain",但中文"完全不痛"到"痛得受不了"這六個(gè)字?jǐn)D在手機(jī)屏上,用戶可能根本沒法精準(zhǔn)點(diǎn)擊。
這時(shí)候可能需要調(diào)整UI,或者使用簡(jiǎn)寫,但這又回到了語言驗(yàn)證的范疇,因?yàn)楹?jiǎn)寫可能改變?cè)狻?得宓臉?biāo)準(zhǔn)做法是,醫(yī)學(xué)翻譯團(tuán)隊(duì)和電子部署團(tuán)隊(duì)必須坐到一起,不是扔個(gè)Word文檔就完事,而是直接在測(cè)試環(huán)境里邊看邊調(diào)。
紙質(zhì)時(shí)代,語言驗(yàn)證主要關(guān)注文本。電子時(shí)代,你得考慮"數(shù)字身體語言"。
| 維度 | 紙質(zhì)量表 | 電子量表 |
| 上下文提示 | 通過字體、間距暗示 | 依賴顏色、圖標(biāo)、動(dòng)畫反饋 |
| 錯(cuò)誤修正 | 可涂改、可回看 | 一旦提交無法修改,提示語必須明確 |
| 文化隱喻 | 文字承載全部 | 圖標(biāo)(如笑臉表情)可能跨文化失效 |
| 方言問題 | 可用標(biāo)準(zhǔn)書面語 | 語音輸入功能必須考慮方言識(shí)別 |
特別是最后一點(diǎn),很多申辦方容易忽略。比如粵語區(qū)的患者,如果電子量表支持語音錄入,"腹瀉"在粵語里是"屙肚屙",但語音識(shí)別可能轉(zhuǎn)寫成"哦度哦"。這時(shí)候語言驗(yàn)證團(tuán)隊(duì)必須提供發(fā)音指導(dǎo)文檔給技術(shù)開發(fā)團(tuán)隊(duì)。
還有日期格式。英文習(xí)慣MM/DD/YYYY,中文通常是YYYY年MM月DD日。但在電子量表里,如果直接調(diào)用系統(tǒng)日期選擇器,iOS和安卓的處理方式不一樣,可能會(huì)導(dǎo)致某些版本的選項(xiàng)讓消費(fèi)者困惑。這些細(xì)節(jié)不會(huì)出現(xiàn)在任何翻譯理論書里,只會(huì)在無數(shù)次試錯(cuò)中積累。
說點(diǎn)行業(yè)里的實(shí)際情況。現(xiàn)在市場(chǎng)上做語言驗(yàn)證的不少,但很多機(jī)構(gòu)是外包給自由譯者,自己做做QC就交貨。康茂峰這幾年摸索出來的經(jīng)驗(yàn)是,必須建立"醫(yī)學(xué)語言學(xué)專家+目標(biāo)地區(qū)臨床醫(yī)生"的雙重把關(guān)機(jī)制。
醫(yī)學(xué)語言學(xué)專家確保術(shù)語符合監(jiān)管要求,比如FDA指導(dǎo)原則里強(qiáng)調(diào)的"conceptual equivalence"(概念等效)。而目標(biāo)地區(qū)的臨床醫(yī)生——我們通常會(huì)找三甲醫(yī)院對(duì)應(yīng)科室的副主任醫(yī)師以上——?jiǎng)t負(fù)責(zé)判斷這個(gè)問法在真實(shí)的門診環(huán)境里會(huì)不會(huì)讓患者覺得尷尬或困惑。
有個(gè)關(guān)于精神疾病的小插曲。原版量表里有"Do you hear voices?",直譯是"你聽到 voices 嗎?",回譯沒問題,認(rèn)知訪談的患者也說"聽到啊,昨天還聽到鄰居吵架"。但實(shí)際上 clinicians know 這是在問"幻聽"。最后改成了"您是否聽到別人聽不到的聲音?"雖然啰嗦,但在電子量表里可以分屏顯示,歧義消除了。
另外,電子量表的更新成本比紙質(zhì)高得多。紙質(zhì)印錯(cuò)了可以發(fā)勘誤表,電子版本一旦部署到幾百個(gè)站點(diǎn),熱更新都可能引發(fā)數(shù)據(jù)一致性問題。所以康茂峰的流程里有個(gè)"凍結(jié)期"概念,在eCOA系統(tǒng)上線前至少留兩周的絕對(duì)靜默期,專門用來讓不同年齡段、不同教育背景的測(cè)試員在真實(shí)設(shè)備上"挑刺"。
維特根斯坦說過這話,用在電子量表翻譯上特別貼切。當(dāng)你把一款在美國開發(fā)的新藥拿到中國做三期臨床,你其實(shí)是在試圖比較兩種文化語境下"疼痛"、"生活質(zhì)量"、"負(fù)擔(dān)"這些主觀體驗(yàn)。如果語言驗(yàn)證做得糙,你得到的不是數(shù)據(jù)噪音,而是系統(tǒng)性的文化偏差。
費(fèi)曼要是還活著,可能會(huì)這樣解釋這個(gè)工作:想象你要給火星人解釋"蘋果的味道",你不能只說"甜"或者"酸",你得確保火星人嘗到的那個(gè)東西,和你當(dāng)初想讓他們嘗到的,是同一個(gè)宇宙里的同一種感覺。電子量表的語言驗(yàn)證,就是在做這種近乎不可能的等價(jià)傳遞,只不過我們手頭的工具是譯文、是代碼、是那些深夜里的認(rèn)知訪談?dòng)涗洝?/p>
所以下次當(dāng)你在手機(jī)上的臨床試驗(yàn)APP里填一個(gè)"您今天的整體健康狀況如何"的滑動(dòng)條時(shí),背后可能藏著六個(gè)翻譯版本的對(duì)比、三次回譯的校準(zhǔn)、還有某個(gè)醫(yī)學(xué)翻譯為了"尚可"和"還行"哪個(gè)更合適而糾結(jié)的下午。這種 invisible craftsmanship,大概就是這個(gè)行業(yè)最迷人的地方。
