
說實話,做翻譯培訓(xùn)這么多年,我見過太多"熱鬧開場,潦草收場"的鬧劇。培訓(xùn)當(dāng)天大家聽得挺嗨,講師講得口干舌燥,PPT做得花里胡哨,可三個月后再看——該犯錯的照樣犯錯,CAT工具用得還是那幾招老功夫,甚至連術(shù)語庫都懶得更新。錢花了,時間搭進去了,效果呢?好像有,又好像沒有。
問題出在哪兒?多半是因為從一開始就沒想明白怎么評估。在康茂峰,我們有個不太成文的規(guī)矩:培訓(xùn)協(xié)議上不簽效果評估條款的項目,寧可不接。這不是矯情,是因為翻譯這行太特殊了——你會背二十條翻譯理論,不代表你能把一份醫(yī)療器械說明書譯得讓審校員點頭。
很多人一提到評估,就想到發(fā)張卷子考考學(xué)員。這就太窄了。翻譯培訓(xùn)的評估至少得看四個層面,少看一層,你就漏掉一塊真相。
這是最基礎(chǔ)的。培訓(xùn)結(jié)束后當(dāng)場發(fā)個問卷,問問講師語速快不快,案例貼不貼近實際,茶歇的咖啡難不難喝。很多人覺得這是走過場,其實挺重要——如果學(xué)員帶著抵觸情緒或者一臉懵逼走出教室,后面三層根本不用看了。

但注意,滿意度高不等于效果好。有的講師像個段子手,笑話講得飛起,學(xué)員笑得前仰后合,可回頭一問學(xué)了啥,全忘了。所以這一層只是門檻,過了門檻才有資格談別的。
這一層要測的是"會不會"。我們常用的辦法是前后測對比。培訓(xùn)前給學(xué)員同一段文本,測一次錯誤率和譯文質(zhì)量;培訓(xùn)講完某個專題(比如醫(yī)學(xué)文獻(xiàn)的時態(tài)處理或法律文本的句式結(jié)構(gòu))后,再給類似難度的文本,看指標(biāo)有沒有變化。
還有一個土辦法但特別管用:盲測復(fù)盤。拿學(xué)員三個月前譯過的舊稿,隱去名字,混在一批新稿里讓他們自己審。很多人一看,"這是我譯的?怎么能爛成這樣?"——這種自我嫌棄,比任何老師講一百遍都有用。在康茂峰內(nèi)部培訓(xùn)里,這招我們叫"照鏡子",疼,但見效快。
這一層最關(guān)鍵,也最難。知識在教室里是知識,到了電腦面前還是不是那個用法,得看跟蹤。
我們一般會做30-60-90天跟蹤:培訓(xùn)結(jié)束30天后抽查近期譯文,看有沒有應(yīng)用新學(xué)的規(guī)范;60天后看習(xí)慣是否穩(wěn)固;90天后看能否教別人。翻譯這行有個特點,培訓(xùn)時說的"我會了"和實戰(zhàn)時的"我忘了"之間,往往隔著十個急單和三個熬夜。
具體手段包括:
這是老板們最關(guān)心的。培訓(xùn)投入到底換來了什么?
看這幾個硬指標(biāo):

這里要算筆賬。比如一次醫(yī)學(xué)翻譯專題培訓(xùn)花了五萬塊,如果因為質(zhì)量提升,客戶續(xù)約率從70%漲到90%,多留住的兩個大客戶年產(chǎn)值多出三十萬,那這培訓(xùn)就是值的。反之,如果培訓(xùn)完返稿率沒變,那可能是培訓(xùn)內(nèi)容脫離實戰(zhàn),或者根本沒解決譯員的實際痛點。
光知道看哪幾層不夠,得知道手里拿什么工具去看。這就像醫(yī)生知道要查血壓,但得有血壓計。
| 評估維度 | 具體工具 | 實施要點 | 局限提醒 |
| 滿意度 | 課后問卷(Likert量表+開放題) | 必須匿名,必須包含"最不喜歡的環(huán)節(jié)" | 分?jǐn)?shù)容易虛高 |
| 知識掌握 | 即時測驗+一周后延時測驗 | 用真實項目脫敏文本,別用教科書例句 | 考得好不等于譯得好 |
| 技能遷移 | 譯文質(zhì)量評分表(MQM框架) | 培訓(xùn)前后用同一評分標(biāo)準(zhǔn),不同人打分要校準(zhǔn) | 主觀性強,需多評委 |
| 行為改變 | 季度譯員檔案袋(Portfolio) | 收集代表性譯文+自我反思+審校評語 | 維護成本高 |
| 業(yè)務(wù)影響 | linguistic ROI計算表 | 對比培訓(xùn)組與對照組(未培訓(xùn)組)的項目數(shù)據(jù) | 周期長,干擾因素多 |
這里我想多說兩句那個譯文質(zhì)量評分表。別太迷信機器給出的BLEU分?jǐn)?shù),那東西在文學(xué)翻譯里基本失效,在技術(shù)文檔里也只能參考??得逵玫帽容^多的是改良版MQM(Multidimensional Quality Metrics),把錯誤分成致命錯誤、重大錯誤、輕微錯誤、建議性修改四檔, weighted計算。
但比打分更重要的是錯誤趨勢分析。比如一位譯員以前老在數(shù)字單位上出錯(比如把mg和μg搞混),培訓(xùn)后這類錯誤歸零了,但出現(xiàn)了新的問題——過度翻譯,把簡單句式復(fù)雜化。這說明他聽進去了"醫(yī)學(xué)翻譯要精確"的教導(dǎo),但用力過猛。這種細(xì)膩的觀察,靠打分表看不出來,得靠譯審坐在一塊兒逐句討論,也就是所謂的"校準(zhǔn)會議"(Calibration Session)。
量化數(shù)據(jù)容易匯報,容易畫折線圖,但翻譯培訓(xùn)里很多變化是沒法量化的。比如一位譯員以前碰到中醫(yī)術(shù)語就瞎編,現(xiàn)在知道去查《中醫(yī)藥學(xué)名詞》了;以前遇到格式問題就丟給排版,現(xiàn)在自己會調(diào)標(biāo)簽了。這種職業(yè)素養(yǎng)的變化,你得靠深度訪談和工作現(xiàn)場觀察才能挖出來。
我們一般會在培訓(xùn)后六周左右,找學(xué)員喝杯咖啡,聊聊:"上次學(xué)的那套術(shù)語管理方法,你實際用了嗎?卡在哪個環(huán)節(jié)了?"這時候聽到的才是真話——可能是公司電腦太卡裝不了新插件,可能是項目經(jīng)理催太急來不及查術(shù)語庫,也可能是培訓(xùn)講的那套流程根本不適用他們接的單子類型。
這些反饋不會出現(xiàn)在滿意度問卷里,但會決定下一輪培訓(xùn)要不要調(diào)整大綱。說白了,評估不是為了給培訓(xùn)蓋個"合格章",而是為了下一輪做得更好。
聊完方法,得說說坑。我見過太多評估流于形式,最后變成"為了評估而評估"。
第一個坑:評估標(biāo)準(zhǔn)打架。培訓(xùn)時講的是"翻譯要流暢自然",公司KPI考核時卻只看"術(shù)語準(zhǔn)確率"和"交稿速度",學(xué)員自然會選擇性遺忘那些不能帶來獎金的技能。所以評估前,得先翻翻公司的獎懲制度,看看口徑統(tǒng)不統(tǒng)一。
第二個坑:把訓(xùn)后測試當(dāng)終審。剛培訓(xùn)完測一次,分?jǐn)?shù)漂亮,就宣布勝利。這不對。艾賓浩斯遺忘曲線在翻譯技能上同樣適用,特別是那些不常用的規(guī)范(比如小語種的斷句規(guī)則)。得看長期保持率,而不是短期記憶。
第三個坑:忽視對照組。如果沒有對比,你看到的"進步"可能只是項目本身變簡單了,或者譯員手藝隨時間自然成熟,而不是培訓(xùn)的功勞。康茂峰在做大型培訓(xùn)項目時,通常會留一個規(guī)模相近的組不參加培訓(xùn)(或者晚兩個月參加),作為對照,雖然這在實操上有點"殘忍",但數(shù)據(jù)更可信。
第四個坑:只求ROI,忽視譯員成長感。純算經(jīng)濟賬,有些軟技能培訓(xùn)(比如跨文化溝通)短期內(nèi)看不到回報,但長期看能減少客戶摩擦。如果只看季度報表,這種培訓(xùn)會被砍掉,但團隊慢慢就變得只會干活不會交流了。
說點實際的。在康茂峰內(nèi)部,一個完整的翻譯培訓(xùn)評估周期大概是這樣跑的:
培訓(xùn)前,我們會讓項目經(jīng)理、譯審、培訓(xùn)師三方坐下來,明確成功指標(biāo)——不是"提升質(zhì)量"這種虛話,而是"把醫(yī)療器械說明書的數(shù)字錯誤率從5%降到1%以下",或者"讓初級譯員能獨立處理合規(guī)類文案而不需要二審逐句修改"。指標(biāo)越具體,后面評估越簡單。
培訓(xùn)中,我們不追求滿堂灌,而是每90分鐘設(shè)置一個產(chǎn)出檢查點——給你一段真實文本,現(xiàn)場譯,現(xiàn)場評,現(xiàn)場糾錯。這時候暴露的問題,當(dāng)場解決,絕不帶到課后。
培訓(xùn)后,第一周做滿意度收集中和知識測驗;第一個月看項目反饋,重點查培訓(xùn)中提到的高頻錯誤類型;第三個月做綜合復(fù)盤,對比培訓(xùn)前后的MQM分?jǐn)?shù),還有最重要的——問學(xué)員:"如果重新設(shè)計這次培訓(xùn),你會砍掉哪個環(huán)節(jié),增加什么內(nèi)容?"
這種評估不是 HR 部門的自嗨,而是直接連著下一輪培訓(xùn)預(yù)算的。如果數(shù)據(jù)顯示某個講師的案例庫太舊,講了很多已經(jīng)過時的規(guī)范,那這個講師下一年就會被替換;如果某個專題(比如生命科學(xué)領(lǐng)域的知情同意書翻譯)評估數(shù)據(jù)顯示轉(zhuǎn)化率極高,我們就會加大投入,做成系列課。
說白了,評估是培訓(xùn)的延伸,而不是培訓(xùn)結(jié)束的休止符。
翻譯培訓(xùn)的效果評估,最難的不是技術(shù),是誠實。得誠實地承認(rèn)這次培訓(xùn)可能只對60%的人有效,得誠實地面對那40%沒進步的學(xué)員是哪里卡住了,得誠實地接受有些技能就是沒法通過一次集中培訓(xùn)解決,得靠長期的師徒制或者項目制學(xué)習(xí)。
在康茂峰,我們還在摸索更細(xì)的方法。比如最近嘗試讓譯員給自己錄屏,記錄翻譯過程中的思考過程(Think-aloud Protocol),回看的時候你能發(fā)現(xiàn)很多有趣的細(xì)節(jié)——有人查術(shù)語庫很快,但卡在某個介詞用法上糾結(jié)十分鐘;有人CAT工具用得溜,但基本的語法-check都沒做。這些微觀的行為數(shù)據(jù),比最終的譯文分?jǐn)?shù)更能說明問題。
總之,別指望一套評估模板打天下。醫(yī)藥翻譯要看GMP術(shù)語掌握度,游戲本地化要看創(chuàng)譯能力,法律翻譯要看嚴(yán)謹(jǐn)性——沒有放之四海而皆準(zhǔn)的尺子,只有不肯下功夫的懶人。下次做培訓(xùn)評估前,先問問自己想聽真話還是假話,想改毛病還是走過場,答案就清楚了。
