
【世界公民】牛津詞典收了幾個中文詞?

本文由世界公民文化中心提供,作者東吳大學英文系教授曾泰元,收錄於英語島 English Island 2019年1月號,INSIDE 獲授權轉載。
更多詳情請見 世界公民文化中心粉絲專頁 。
2018 年 10 月中旬,我首度發現直譯自中文「加油」的 add oil 收進了《牛津英語詞典》(Oxford English Dictionary,簡稱 OED),這個語言上的現象引爆了廣泛且高度的熱議,不僅紅遍海峽兩岸及香港、澳門,甚至傳播到了東南亞與北美的華語圈。許多英文媒體跟進報導,就連本該與此無關的日本、西班牙、法國、土耳其等國,也能看到這條漢英語言的新聞。
於此稍早的 10 月上旬,我的另一個發現就冷清許多,沒受到什麼關注。OED 在其年度第 3 季的更新中,增收了源自中文、漢傳佛教「禪」的音譯詞 Chan,這則添補得以讓英語世界認識到,禪宗不是只有日本的 Zen,更有日本禪宗源頭的中國禪宗。

我研究 OED 多年,常有學界的前輩、朋友問我,在這部英語世界的詞彙寶庫裡,究竟收錄了多少源自中文的詞語?網上有人說 120 個,有人說 200 多個,甚至有人說 1000 多個。數字差距如此懸殊,到底哪一個答案才對?
答案應該是官方說法的兩倍
2018 年 11 月 19 日,牛津大學出版社(中國)的詞典部總編輯劉浩賢 (Franky Lau) 出面,在接受媒體的採訪時表示,英國 OED 編輯部提供的數字是 250 個。
牛津英國總部的說法看似一槌定音,然而我卻半信半疑。胡適曾說,做學問要在不疑處有疑,於是我便在眾說紛紜之中,花了一週的時間,從早到晚密集研究。根據我得出的第一手資料,我的答案是 500 個左右,數字是 OED 官方說法的兩倍。
在回答問題前,請容我先把必要的背景說明一下。
如何統計英語詞典裡的中文字?
我在 2005 年曾經做過一個類似的研究,不過對象是規模較小、2 大冊的《牛津英語詞典簡編》(Shorter Oxford English Dictionary,簡稱 SOED)。這套 SOED 是 20 大冊完整版 OED 的節本 (abridgement),當年的統計數字是 250 個左右,詳細的詞表發佈在大陸的《廣東外語外貿大學學報》上。
如果有人認為,「2 大冊有 250 個中文詞語,20 大冊是 10 倍的規模,所以中文詞語的總數就是 2500 個」,如此推論就差之毫釐、謬以千里了,因為這不是個簡單的算術問題。簡編版的 SOED 保留了完整版 OED 大多數的詞語條目,只是在詞源、定義、書證等其他地方刪節壓縮。是故,欲知 OED 收錄了多少中文詞語,這研究還得從頭做起,無法貪快,沒有捷徑可走。
有幾個觀念也得界定釐清,否則這項研究無法進行。
判定標準一:源自中文,還必須是「漢語」
首先,什麼是源自中文的詞語?這問題看似容易,實則不然。根據大陸權威的《現代漢語詞典》所載,中文是「中國的語言文字,特指漢族的語言文字」。準此,OED 收錄的 Kalgan(喀拉干,河北省張家口的舊稱),用來指稱張家口特產的羊毛皮,因其源自蒙古語,我就覺得不該算。同理,OED 收錄的 Lhasa Apso(拉薩犬)源自藏語,也不能算是源自中文的詞語。然而,OED 收錄的 hutung(胡同,威妥瑪拼音)就得算,因為追本溯源,「胡同」雖來自蒙古語,唯其漢化已深,早已是漢語詞彙的堅定的一員。OED 也收錄了 Manchu(滿族;滿語),該詞雖源自滿州語,道理同上,也得算是源自中文的詞語。
實際的情況,有些並非這麼黑白分明。碰到棘手的例子,我只能運用我的專業知識,在幾分掙扎之後,逐一迅速下判斷了。
判定標準二:音譯、借譯才算外來語
另外,怎麼樣的中文詞語才算是英文裡的「外來語」?我認為「異化」較深的才算,這其中包含兩大類。其一是音譯詞(transliteration,即語音轉寫),如:

其二是借譯詞(calque,即逐字翻譯),如:

當然,這個部分在操作的時候,情況也沒有想像中的清楚明瞭,有時還得根據自身的認知加以取捨。茲舉數例。英文裡有些音譯詞最終來自中文,然而卻是透過其他語言進入英文的,如:

我基於理性,把這類詞排除在外,但做這個決定時,心裡是有幾分痛苦和不平的。
英文有些依中文而造的借譯詞,結構、內容上並不夠嚴謹,如:

碰到這種情況,我依照OED的詞源和定義,參考漢英詞語之間的吻合度,做出綜合判斷。「紅包」的red envelope和「燕窩」的bird’s-nest soup,此二者我把它們納入計算,視之為英文裡來自中文的借譯詞。
如果概念事物是中國的,但英文的對應是相對自由的意譯,我便傾向於將之排除在外,如:

500個中文詞語,多數不親民
1989 年第 2 版的 OED 有 20 大冊,紙質詞典只能用於個別詞語的翻查瀏覽,無法做系統、深入的學術研究。最新的 OED 是個有償使用的超大型線上詞典,是個在第 2 版的基礎上整合更新而成的巨型電子資料庫。
身為 OED 的訂戶,我藉由官網上的進階搜尋 (Advanced search),配合地毯式的審閱與交叉求證,電腦、手動雙管齊下,按照上揭的原則,花了一週的潛心鑽研,終於整理出了最新的研究成果。《牛津英語詞典》,這個簡稱為 OED的英語詞彙終極寶庫,究竟一共收錄了多少源自中文的詞語?我的答案是,500 個左右。
說「左右」,是因為有一些我主觀判斷的成分,有一些我對衍生詞和複合詞的取捨,甚至我可能遺漏了部分詞語。
我對這個詞表的整體印象是,500 個左右的詞語中,大部分既冷僻又專業,反映了 OED 這個曠世巨著長久以來的體質。OED 於 1857 年正式啟動,迄今百餘年,是個早年英國文人醉心其中的計畫,內容以「高大上」著稱,近來雖調整了方向,儘量反映英語的全貌,試圖貼近庶民的生活,不過高大上的體質依舊。
*高大上:中國流行語,全稱「高端、大氣、上檔次」。
按類別來看,在來自中文的 500 個左右詞語裡,依數量多寡排列:

哲學宗教 20 個左右、地方(特產)20 個左右、棋藝遊戲 15 個左右、歷史 15 個左右、情感表達 15 個左右、各色人等 15 個左右、音樂戲曲 15 個左右、朝代 15 個左右、商業貨幣 15 個左右、社會黑暗面 15 個左右、中醫中藥 10 個左右、布料服飾 10 個左右、植物 10 個左右、動物 10 個左右、武術健身 10 個左右,建築、度量衡、書法、自然物質 4 項均不足 10 個。
這是先有結果再行分門別類的,分類時也常碰到一些兩難的情況。比如地名,OED 收錄的地名幾乎都不是單純的地名,而是作為修飾語,用以表該地的歷史、語言、特產、風格等,因此在定其歸屬時僅能擇一而為,有時單純,有時只得武斷。
這個 500 詞表的體量偏大,本文難以容納,將於下一期完整刊出,敬請期待。