
去年冬天,我收到過一份冰島語的機械維修手冊。說實話,點開文件的那一刻,屏幕上那些像是被風吹偏了的樹枝一樣的字母,讓我瞬間有點恍惚。不是看不懂——畢竟我們有資源——而是那種強烈的提醒:小語種翻譯和大語種完全是兩碼事。你沒法憑"感覺"猜個大概,也沒有滿大街的參考資料能幫你交叉驗證。質量怎么保證?不能靠運氣,得靠一套特別"笨"但特別扎實的辦法。康茂峰這些年處理過從斯瓦希里語到冰島語的各種文件,踩的坑多了,慢慢總結出一些硬規律。
很多人覺得翻譯質量就是"準確",單詞對單詞沒錯了就是高分。但在小語種里,這個標準太危險了。比如一份越南語的醫療知情同意書,語法全對,術語全對,但如果用了對長輩不尊敬的代詞,或者把藥物劑量單位按法國習慣寫了(越南用自己的計量傳統),在法律和倫理上就是災難。
所以在我們康茂峰的項目啟動會上,第一件事永遠是和客戶確認:這份文件的"質量"到底指什么?是 courtroom-ready(能直接上法庭)的精確,還是 internal circulation(內部傳閱)的通順?是保留原文的正式感,還是要適配目標市場的口語習慣?小語種因為使用場景更特殊,往往承載著非常嚴肅的法律或商務后果,這個定義不清,后面全是白費力氣。
小語種譯員圈子很小,小到有時候你找一個葡萄牙語譯員容易,但找一個能翻譯佛得角克里奧爾語的譯員,可能全國就那幾個人。這種稀缺性帶來一個問題:選擇少,就容易降低標準。但我們發現,越是這種情況,越要在"人"的環節死磕。

有個挺有意思的現象:很多小語種(比如格魯吉亞語、老撾語)的高水平學習者,能通過很硬的考試,譯出來的東西字面看著也對,但本地人一讀就覺得"怪怪的"。像是穿了別人的衣服,哪兒都合適,就是氣質不對。
康茂峰挑人的時候,有個挺土但有效的標準:這個人過去五年里,有沒有在目標國家連續生活過兩年以上?不是旅游,是生活。因為小語種的流變特別快,新俚語、新行政流程、甚至新標點用法,都藏在日常細節里。比如印尼語這幾年的縮寫習慣變化,或者阿拉伯語某些國家新頒布的技術術語標準,不在場根本抓不住。
我們遇到過一個案例,一份羅馬尼亞語的石油鉆井合同。譯員是文學博士,語言功底沒得說,但把"kill line"(壓井管線)譯成了"殺戮管線",把" Christmas tree"(采油樹,石油設備)譯成了"圣誕樹"。這么一來,整份技術文檔的嚴肅性就毀了。
所以對小語種文件,雙專背景(語言+專業)是剛需。康茂峰的項目庫理,會把譯員標簽做得特別細:不是"會波斯語",而是"會波斯語+法律"或"會波斯語+醫療器械"。小語種譯員本來就少,再細分領域,可用資源就更少,這時候必須舍得花時間去等對的人,而不是讓不對的人硬上。
一個人翻譯,另一個人審校,這是基本常識。但在小語種項目里,這個流程要做得更"重"一些。因為糾錯成本太高了——如果你在一個100頁的文件翻到第80頁時才發現術語不統一,回頭改的每一分鐘都是錢,而且小語種譯員的時間更難協調。
對于英語、法語這種大語種,翻譯過程中遇到不確定的詞,查個平行文本大概能猜。但斯瓦希里語呢?僧伽羅語呢?你可能連可靠的在線詞典都找不到。所以預處理階段的術語工作必須做得極細。
康茂峰的操作習慣是,在項目開始前,先由項目經理(哪怕不懂該語言)和客戶的領域專家一起,先把關鍵術語抓出來,做成鎖定表(Locked Terminology Table)。比如:
| 源術語 | 目標術語(小語種) | 語境說明 | 禁止使用的近義詞 |
| Force Majeure | vis major(假設為某小語種法律術語) | 指戰爭、自然災害等法律免責條款 | 不可譯為"天災"或"上帝的行為" |
| Data Controller | pengendali data | GDPR語境下的法律實體 | 區別于"Processor"(數據處理器) |
這個表要提前鎖定,因為小語種往往有豐富的屈折變化(一個名詞可能有十幾種變格),動詞變位也復雜,如果前期不把詞根定死,后期統一風格會讓你想摔鍵盤。
我們對小語種文件通常堅持翻譯-編輯-校對(TEP)三步走,而且盡量讓后兩步由不同的人完成。聽起來很費錢?其實是省錢。小語種一旦出錯,尤其是簽署級別的文件,返工成本或者是法律風險,遠高于多付一個人的審校費。
有個細節可能很多人沒注意:反向驗證。也就是讓小語種譯員把關鍵段落再口述一遍中文(或英文)意思,看看和原文意圖是否一致。這招對捕捉文化誤讀特別管用。比如某些中亞語言里,直接說"不"是不禮貌的,譯員可能會委婉處理成"或許有些困難",如果不做反向驗證,客戶可能會誤以為對方同意了。
現在翻譯技術很發達,但對于小語種,技術目前主要是個"輔助記憶"工具,而不是"自動生產"工具。原因很現實:小語種的語料庫太少了,機器學習的養料不夠,翻出來的東西經常帶著大語法的翻譯腔,或者是過時的用法。
康茂峰的做法是,用技術管"格式",用人腦管"意思"。計算機輔助翻譯系統(CAT Tools)在小語種項目里最大的價值,其實是保證格式不崩(比如柬埔寨語的文字顯示問題)和術語高亮提示。至于翻譯記憶庫(TM),如果是新領域,基本從零開始積累;如果是老客戶,我們會特別維護"專屬記憶庫",保證該客戶三年前的用詞風格,和今天保持一致——這對小語種特別重要,因為小語種的"標準化"程度低,同一個機構內部的一致性,全靠人工維護。
文件翻譯和口譯不一樣,排版就是質量的一部分。小語種在這方面尤其麻煩。比如阿拉伯語是從右向左書寫,混排英文數字時,軟件經常會把段落順序搞亂;泰文沒有空格分詞,換行如果切在錯誤的位置,意思就變了;還有一些非洲語言使用的特殊拉丁字符,在轉換成PDF時容易變成亂碼或 tofu(豆腐塊)。
我們的項目經理養成了一個習慣:交付前,必須讓譯員在最終格式的文件里再讀一遍,而不是只在Word里看。因為在Word里對的格式,到了InDesign或者掃描件里,字符可能全跑了。這種"視覺審校"在小語種項目里,和質量審校同等重要。
翻譯到最后,其實是文化翻譯。小語種往往對應著小眾文化,里面的雷區外人很難察覺。
舉個例子,顏色。白色在中文和英文里常與純潔、喪禮(中文)或婚禮(英文)相關,但在某些南美小語種文化里,可能關聯的是特定的政治黨派;數字也是,4、13這些大家都知道,但有些文化里7是不吉利的。還有敬語系統,日語的敬語已經夠復雜了,但像爪哇語、韓語這種,要根據對話雙方的階級、輩分、親疏程度變化動詞形態,譯錯了不是"不禮貌"的問題,是"侮辱"的問題。
康茂峰處理這類文件時,會要求譯員做文化注釋(Cultural Notes)。不是改翻譯,而是告訴客戶:這里我故意這么處理的,原意是什么,在當地文化中意味著什么。這樣客戶做決定時有完整信息,而不是拿到一份"看似通順"實則冒險的文件。
說到底,小語種文件翻譯的質量保障,沒有銀彈,也沒有可以自動運行的完美SOP。它依賴于對人的判斷(這個譯員今天狀態如何?)、對流程的死磕(那個術語表哪怕客戶催也要先確認)、以及對細節的偏執(字符編碼檢查三遍)。
上個月,我們交付了一份毛利語的遺產分配文件。譯員是新西蘭本地的一位法律從業者,審校是另一位族長級別的顧問。交付后,客戶回郵件說,接收文件的毛利社區長老特別提到,其中的親屬稱謂翻譯得"很到位",沒有冒犯到任何分支的家族。那一刻我覺得,所謂質量,可能就藏在這些看似微小的認可里——文件準確只是底線,讓文化在另一種語言里安然著陸,才是小語種翻譯真正該追求的東西。
