【世界公民】牛津詞典收了幾個中文詞?

「我研究牛津詞典多年,常有學界的前輩、朋友問我,在這部英語世界的詞彙寶庫裡,究竟收錄了多少源自中文的詞語?網上有人說 120 個,有人說 200 多個,甚至有人說 1000 多個。數字差距如此懸殊,到底哪一個答案才對?」
評論
Photo Credit: 世界公民文化中心提供
評論

本文由世界公民文化中心提供,作者東吳大學英文系教授曾泰元,收錄於英語島 English Island 2019年1月號,INSIDE 獲授權轉載。

更多詳情請見 世界公民文化中心粉絲專頁

2018 年 10 月中旬,我首度發現直譯自中文「加油」的 add oil 收進了《牛津英語詞典》(Oxford English Dictionary,簡稱 OED),這個語言上的現象引爆了廣泛且高度的熱議,不僅紅遍海峽兩岸及香港、澳門,甚至傳播到了東南亞與北美的華語圈。許多英文媒體跟進報導,就連本該與此無關的日本、西班牙、法國、土耳其等國,也能看到這條漢英語言的新聞。

於此稍早的 10 月上旬,我的另一個發現就冷清許多,沒受到什麼關注。OED 在其年度第 3 季的更新中,增收了源自中文、漢傳佛教「禪」的音譯詞 Chan,這則添補得以讓英語世界認識到,禪宗不是只有日本的 Zen,更有日本禪宗源頭的中國禪宗。

Photo Credit: 世界公民文化中心提供

我研究 OED 多年,常有學界的前輩、朋友問我,在這部英語世界的詞彙寶庫裡,究竟收錄了多少源自中文的詞語?網上有人說 120 個,有人說 200 多個,甚至有人說 1000 多個。數字差距如此懸殊,到底哪一個答案才對?

答案應該是官方說法的兩倍

2018 年 11 月 19 日,牛津大學出版社(中國)的詞典部總編輯劉浩賢 (Franky Lau) 出面,在接受媒體的採訪時表示,英國 OED 編輯部提供的數字是 250 個。

牛津英國總部的說法看似一槌定音,然而我卻半信半疑。胡適曾說,做學問要在不疑處有疑,於是我便在眾說紛紜之中,花了一週的時間,從早到晚密集研究。根據我得出的第一手資料,我的答案是 500 個左右,數字是 OED 官方說法的兩倍。

在回答問題前,請容我先把必要的背景說明一下。

如何統計英語詞典裡的中文字?

我在 2005 年曾經做過一個類似的研究,不過對象是規模較小、2 大冊的《牛津英語詞典簡編》(Shorter Oxford English Dictionary,簡稱 SOED)。這套 SOED 是 20 大冊完整版 OED 的節本 (abridgement),當年的統計數字是 250 個左右,詳細的詞表發佈在大陸的《廣東外語外貿大學學報》上。

如果有人認為,「2 大冊有 250 個中文詞語,20 大冊是 10 倍的規模,所以中文詞語的總數就是 2500 個」,如此推論就差之毫釐、謬以千里了,因為這不是個簡單的算術問題。簡編版的 SOED 保留了完整版 OED 大多數的詞語條目,只是在詞源、定義、書證等其他地方刪節壓縮。是故,欲知 OED 收錄了多少中文詞語,這研究還得從頭做起,無法貪快,沒有捷徑可走。

有幾個觀念也得界定釐清,否則這項研究無法進行。

判定標準一:源自中文,還必須是「漢語」

首先,什麼是源自中文的詞語?這問題看似容易,實則不然。根據大陸權威的《現代漢語詞典》所載,中文是「中國的語言文字,特指漢族的語言文字」。準此,OED 收錄的 Kalgan(喀拉干,河北省張家口的舊稱),用來指稱張家口特產的羊毛皮,因其源自蒙古語,我就覺得不該算。同理,OED 收錄的 Lhasa Apso(拉薩犬)源自藏語,也不能算是源自中文的詞語。然而,OED 收錄的 hutung(胡同,威妥瑪拼音)就得算,因為追本溯源,「胡同」雖來自蒙古語,唯其漢化已深,早已是漢語詞彙的堅定的一員。OED 也收錄了 Manchu(滿族;滿語),該詞雖源自滿州語,道理同上,也得算是源自中文的詞語。

實際的情況,有些並非這麼黑白分明。碰到棘手的例子,我只能運用我的專業知識,在幾分掙扎之後,逐一迅速下判斷了。

判定標準二:音譯、借譯才算外來語

另外,怎麼樣的中文詞語才算是英文裡的「外來語」?我認為「異化」較深的才算,這其中包含兩大類。其一是音譯詞(transliteration,即語音轉寫),如:

Photo Credit: 世界公民文化中心提供

其二是借譯詞(calque,即逐字翻譯),如:

Photo Credit: 世界公民文化中心提供

當然,這個部分在操作的時候,情況也沒有想像中的清楚明瞭,有時還得根據自身的認知加以取捨。茲舉數例。英文裡有些音譯詞最終來自中文,然而卻是透過其他語言進入英文的,如:

Photo Credit: 世界公民文化中心提供

我基於理性,把這類詞排除在外,但做這個決定時,心裡是有幾分痛苦和不平的。

英文有些依中文而造的借譯詞,結構、內容上並不夠嚴謹,如:

Photo Credit: 世界公民文化中心提供

碰到這種情況,我依照OED的詞源和定義,參考漢英詞語之間的吻合度,做出綜合判斷。「紅包」的red envelope和「燕窩」的bird’s-nest soup,此二者我把它們納入計算,視之為英文裡來自中文的借譯詞。

如果概念事物是中國的,但英文的對應是相對自由的意譯,我便傾向於將之排除在外,如:

Photo Credit: 世界公民文化中心提供

500個中文詞語,多數不親民

1989 年第 2 版的 OED 有 20 大冊,紙質詞典只能用於個別詞語的翻查瀏覽,無法做系統、深入的學術研究。最新的 OED 是個有償使用的超大型線上詞典,是個在第 2 版的基礎上整合更新而成的巨型電子資料庫。

身為 OED 的訂戶,我藉由官網上的進階搜尋 (Advanced search),配合地毯式的審閱與交叉求證,電腦、手動雙管齊下,按照上揭的原則,花了一週的潛心鑽研,終於整理出了最新的研究成果。《牛津英語詞典》,這個簡稱為 OED的英語詞彙終極寶庫,究竟一共收錄了多少源自中文的詞語?我的答案是,500 個左右。

說「左右」,是因為有一些我主觀判斷的成分,有一些我對衍生詞和複合詞的取捨,甚至我可能遺漏了部分詞語。

我對這個詞表的整體印象是,500 個左右的詞語中,大部分既冷僻又專業,反映了 OED 這個曠世巨著長久以來的體質。OED 於 1857 年正式啟動,迄今百餘年,是個早年英國文人醉心其中的計畫,內容以「高大上」著稱,近來雖調整了方向,儘量反映英語的全貌,試圖貼近庶民的生活,不過高大上的體質依舊。

*高大上:中國流行語,全稱「高端、大氣、上檔次」。

按類別來看,在來自中文的 500 個左右詞語裡,依數量多寡排列:

Photo Credit: 世界公民文化中心提供

哲學宗教 20 個左右、地方(特產)20 個左右、棋藝遊戲 15 個左右、歷史 15 個左右、情感表達 15 個左右、各色人等 15 個左右、音樂戲曲 15 個左右、朝代 15 個左右、商業貨幣 15 個左右、社會黑暗面 15 個左右、中醫中藥 10 個左右、布料服飾 10 個左右、植物 10 個左右、動物 10 個左右、武術健身 10 個左右,建築、度量衡、書法、自然物質 4 項均不足 10 個。

這是先有結果再行分門別類的,分類時也常碰到一些兩難的情況。比如地名,OED 收錄的地名幾乎都不是單純的地名,而是作為修飾語,用以表該地的歷史、語言、特產、風格等,因此在定其歸屬時僅能擇一而為,有時單純,有時只得武斷。

這個 500 詞表的體量偏大,本文難以容納,將於下一期完整刊出,敬請期待。


【 MarTech Asia 】數位轉型突圍!萬里雲推出機器人寫文案服務,以 AI 加速行銷流程

CloudMile 萬里雲旗下 Martech 產品── ADsvantage (廣告智庫)全新 2.0 功能上線,採用非營利人工智慧組織 —— OpenAI 強大的文章產成器 「 GPT 系列」為基礎,推出全新 AI 智慧寫手功能。
評論
Photo Credit:CloudMile
評論

 CloudMile  萬里雲旗下 Martech 產品── ADsvantage(廣告智庫)全新 2.0 功能上線,採用非營利人工智慧組織 —— OpenAI  強大的文章產成器「 GPT 系列」為基礎,推出全新 AI 智慧寫手功能。隨著行銷碎片化時代來臨,消費者的用戶輪廓越來越難拼湊,從獲取資料、數據分析,到廣告文案創作的最後一哩路,行銷人員必須借助更多工具幫忙,奪回行銷效益的掌握度。 ADsvantage 提供台灣中小企業行銷人員、廣告主及電商業者自助管理的廣告平台,大幅縮短廣告行銷人員作業時間。

 ADsvantage 推出新功能,受邀 2021 MarTech Asia 分享 AI 化數據行銷

日前全台最大的行銷科技盛會 2021 MarTech Asia ,阿物科技創辦人暨執行長林思吾號召 26 位業界領袖同台 ,現場及線上共有超過 1,800 位全球及台灣相關業者齊聚一堂,包括行銷科技之父 Scott Brinker、前 Verizon Media 國際事業董事總經理鄒開蓮、全聯實業副董事長謝健南等人,分享行銷科技的重要趨勢及後疫情時代的新生態。 CloudMile 萬里雲營運長高斌恒也受邀分享,各個科技巨頭都紛紛有許多針對隱私權的規範和措施,消費者的線上線下界線越來越模糊。 當今行銷人所面對的難題不只是 SEO、投放優化而已,「數據」才是致勝關鍵,透過將許多流程自動化,省下時間與人力成本的情況下,達到更高的行銷目標,其中包括 Cookieless 時代來臨、深化 OMO 無縫體驗、打造顧客數據平台( Customer Data Platform , CDP )等議題都受到業界高度關注。

豐富跨國實戰經驗的 CloudMile 機器學習團隊,運用超過 500 萬的文案數據庫、橫跨 20 種產業以上的廣告量,結合廣告代理商 20 年以上行銷經驗,創造 ADsvantage 「 AI 智慧寫手」 新功能。 CloudMile 看見客戶對於數位轉型及運用 MarTech 行銷科技推廣商品的急迫需求,希望可運用 AI 技術之力,縮短廣告前期企劃、發想關鍵字詞、寫文案和廣告投放設定,同時還需跨組溝通,尋找資源協助的時程, ADsvantage 廣告智庫即是專為滿足客戶後疫行銷需求的一站式廣告營運平台解決方案。

人工智慧寫手結合電商平台, 加速行銷流程的最佳 AI 助理

 ADsvantage 全新 2.0 功能上線,採用 GPT 模型,為矽谷時下最夯的自然語言處理模型,推出全新 AI 智慧寫手功能,透過平台能協助客戶透過數據匯流、 AI 分析達到預測的成效,快速蒐集最熱門的關鍵字、文案內容,加速創意的過程並提升廣告效率。

此全新產品適合應用在電商等大型網購平台上,透過機器學習與 AI 科技應用,讓中間產製時間被大幅被縮短,並提升操作數位行銷的「效率」與「精準度」,像是電商平台即可透過採用 ADsvantage 的服務,有效提升自己在數位行銷上的競爭力。

Photo Credit:CloudMile
ADsvantage 全新 2.0 功能上線,推出 AI 華語文案生成工具「AI 智慧寫手」。/Photo Credit:CloudMile

 ADsvantage 產品介紹

運用 AI 科技力助企業數位轉型的 CloudMile 萬里雲,發表關鍵字數位廣告輿情系統 ADsvantage(廣告智庫),提供企業廣告主及電商平台,透過超過百萬的文案創意庫( Ads  idea ) 、 AI 智慧監控工具及 AI 智慧寫手,平均只要 3 秒即可生成一個廣告文案。 CloudMile 透過 Google 雲端、機器學習與 AI 大數據分析技術,致力協助企業落實數位轉型。疫情期間抓住需求開發的 ADsvantage ( 廣告智庫) 服務,透過服務台灣、新加坡、及香港逾 400 家客戶的專業經驗,將傳統的商業廣告運營模式數據化,提供企業廣告主一站式 Google Ads 廣告文案創作 AI 化平台。

本文章內容由「阿物科技」提供,經關鍵評論網媒體集團廣編企劃編審。