【世界公民】牛津詞典收了幾個中文詞?

評論
評論
Photo Credit: 世界公民文化中心提供

本文由世界公民文化中心提供,作者東吳大學英文系教授曾泰元,收錄於英語島 English Island 2019年1月號,INSIDE 獲授權轉載。

更多詳情請見 世界公民文化中心粉絲專頁

2018 年 10 月中旬,我首度發現直譯自中文「加油」的 add oil 收進了《牛津英語詞典》(Oxford English Dictionary,簡稱 OED),這個語言上的現象引爆了廣泛且高度的熱議,不僅紅遍海峽兩岸及香港、澳門,甚至傳播到了東南亞與北美的華語圈。許多英文媒體跟進報導,就連本該與此無關的日本、西班牙、法國、土耳其等國,也能看到這條漢英語言的新聞。

於此稍早的 10 月上旬,我的另一個發現就冷清許多,沒受到什麼關注。OED 在其年度第 3 季的更新中,增收了源自中文、漢傳佛教「禪」的音譯詞 Chan,這則添補得以讓英語世界認識到,禪宗不是只有日本的 Zen,更有日本禪宗源頭的中國禪宗。

image2
Photo Credit: 世界公民文化中心提供

我研究 OED 多年,常有學界的前輩、朋友問我,在這部英語世界的詞彙寶庫裡,究竟收錄了多少源自中文的詞語?網上有人說 120 個,有人說 200 多個,甚至有人說 1000 多個。數字差距如此懸殊,到底哪一個答案才對?

答案應該是官方說法的兩倍

2018 年 11 月 19 日,牛津大學出版社(中國)的詞典部總編輯劉浩賢 (Franky Lau) 出面,在接受媒體的採訪時表示,英國 OED 編輯部提供的數字是 250 個。

牛津英國總部的說法看似一槌定音,然而我卻半信半疑。胡適曾說,做學問要在不疑處有疑,於是我便在眾說紛紜之中,花了一週的時間,從早到晚密集研究。根據我得出的第一手資料,我的答案是 500 個左右,數字是 OED 官方說法的兩倍。

在回答問題前,請容我先把必要的背景說明一下。

如何統計英語詞典裡的中文字?

我在 2005 年曾經做過一個類似的研究,不過對象是規模較小、2 大冊的《牛津英語詞典簡編》(Shorter Oxford English Dictionary,簡稱 SOED)。這套 SOED 是 20 大冊完整版 OED 的節本 (abridgement),當年的統計數字是 250 個左右,詳細的詞表發佈在大陸的《廣東外語外貿大學學報》上。

如果有人認為,「2 大冊有 250 個中文詞語,20 大冊是 10 倍的規模,所以中文詞語的總數就是 2500 個」,如此推論就差之毫釐、謬以千里了,因為這不是個簡單的算術問題。簡編版的 SOED 保留了完整版 OED 大多數的詞語條目,只是在詞源、定義、書證等其他地方刪節壓縮。是故,欲知 OED 收錄了多少中文詞語,這研究還得從頭做起,無法貪快,沒有捷徑可走。

有幾個觀念也得界定釐清,否則這項研究無法進行。

判定標準一:源自中文,還必須是「漢語」

首先,什麼是源自中文的詞語?這問題看似容易,實則不然。根據大陸權威的《現代漢語詞典》所載,中文是「中國的語言文字,特指漢族的語言文字」。準此,OED 收錄的 Kalgan(喀拉干,河北省張家口的舊稱),用來指稱張家口特產的羊毛皮,因其源自蒙古語,我就覺得不該算。同理,OED 收錄的 Lhasa Apso(拉薩犬)源自藏語,也不能算是源自中文的詞語。然而,OED 收錄的 hutung(胡同,威妥瑪拼音)就得算,因為追本溯源,「胡同」雖來自蒙古語,唯其漢化已深,早已是漢語詞彙的堅定的一員。OED 也收錄了 Manchu(滿族;滿語),該詞雖源自滿州語,道理同上,也得算是源自中文的詞語。

實際的情況,有些並非這麼黑白分明。碰到棘手的例子,我只能運用我的專業知識,在幾分掙扎之後,逐一迅速下判斷了。

判定標準二:音譯、借譯才算外來語

另外,怎麼樣的中文詞語才算是英文裡的「外來語」?我認為「異化」較深的才算,這其中包含兩大類。其一是音譯詞(transliteration,即語音轉寫),如:

image3
Photo Credit: 世界公民文化中心提供

其二是借譯詞(calque,即逐字翻譯),如:

image4-2
Photo Credit: 世界公民文化中心提供

當然,這個部分在操作的時候,情況也沒有想像中的清楚明瞭,有時還得根據自身的認知加以取捨。茲舉數例。英文裡有些音譯詞最終來自中文,然而卻是透過其他語言進入英文的,如:

image5
Photo Credit: 世界公民文化中心提供

我基於理性,把這類詞排除在外,但做這個決定時,心裡是有幾分痛苦和不平的。

英文有些依中文而造的借譯詞,結構、內容上並不夠嚴謹,如:

image6
Photo Credit: 世界公民文化中心提供

碰到這種情況,我依照OED的詞源和定義,參考漢英詞語之間的吻合度,做出綜合判斷。「紅包」的red envelope和「燕窩」的bird’s-nest soup,此二者我把它們納入計算,視之為英文裡來自中文的借譯詞。

如果概念事物是中國的,但英文的對應是相對自由的意譯,我便傾向於將之排除在外,如:

image7
Photo Credit: 世界公民文化中心提供

500個中文詞語,多數不親民

1989 年第 2 版的 OED 有 20 大冊,紙質詞典只能用於個別詞語的翻查瀏覽,無法做系統、深入的學術研究。最新的 OED 是個有償使用的超大型線上詞典,是個在第 2 版的基礎上整合更新而成的巨型電子資料庫。

身為 OED 的訂戶,我藉由官網上的進階搜尋 (Advanced search),配合地毯式的審閱與交叉求證,電腦、手動雙管齊下,按照上揭的原則,花了一週的潛心鑽研,終於整理出了最新的研究成果。《牛津英語詞典》,這個簡稱為 OED的英語詞彙終極寶庫,究竟一共收錄了多少源自中文的詞語?我的答案是,500 個左右。

說「左右」,是因為有一些我主觀判斷的成分,有一些我對衍生詞和複合詞的取捨,甚至我可能遺漏了部分詞語。

我對這個詞表的整體印象是,500 個左右的詞語中,大部分既冷僻又專業,反映了 OED 這個曠世巨著長久以來的體質。OED 於 1857 年正式啟動,迄今百餘年,是個早年英國文人醉心其中的計畫,內容以「高大上」著稱,近來雖調整了方向,儘量反映英語的全貌,試圖貼近庶民的生活,不過高大上的體質依舊。

*高大上:中國流行語,全稱「高端、大氣、上檔次」。

按類別來看,在來自中文的 500 個左右詞語裡,依數量多寡排列:

image8
Photo Credit: 世界公民文化中心提供

哲學宗教 20 個左右、地方(特產)20 個左右、棋藝遊戲 15 個左右、歷史 15 個左右、情感表達 15 個左右、各色人等 15 個左右、音樂戲曲 15 個左右、朝代 15 個左右、商業貨幣 15 個左右、社會黑暗面 15 個左右、中醫中藥 10 個左右、布料服飾 10 個左右、植物 10 個左右、動物 10 個左右、武術健身 10 個左右,建築、度量衡、書法、自然物質 4 項均不足 10 個。

這是先有結果再行分門別類的,分類時也常碰到一些兩難的情況。比如地名,OED 收錄的地名幾乎都不是單純的地名,而是作為修飾語,用以表該地的歷史、語言、特產、風格等,因此在定其歸屬時僅能擇一而為,有時單純,有時只得武斷。

這個 500 詞表的體量偏大,本文難以容納,將於下一期完整刊出,敬請期待。

評論