【世界公民】牛津詞典收了幾個中文詞?

「我研究牛津詞典多年,常有學界的前輩、朋友問我,在這部英語世界的詞彙寶庫裡,究竟收錄了多少源自中文的詞語?網上有人說 120 個,有人說 200 多個,甚至有人說 1000 多個。數字差距如此懸殊,到底哪一個答案才對?」
評論
Photo Credit: 世界公民文化中心提供
評論

本文由世界公民文化中心提供,作者東吳大學英文系教授曾泰元,收錄於英語島 English Island 2019年1月號,INSIDE 獲授權轉載。

更多詳情請見 世界公民文化中心粉絲專頁

2018 年 10 月中旬,我首度發現直譯自中文「加油」的 add oil 收進了《牛津英語詞典》(Oxford English Dictionary,簡稱 OED),這個語言上的現象引爆了廣泛且高度的熱議,不僅紅遍海峽兩岸及香港、澳門,甚至傳播到了東南亞與北美的華語圈。許多英文媒體跟進報導,就連本該與此無關的日本、西班牙、法國、土耳其等國,也能看到這條漢英語言的新聞。

於此稍早的 10 月上旬,我的另一個發現就冷清許多,沒受到什麼關注。OED 在其年度第 3 季的更新中,增收了源自中文、漢傳佛教「禪」的音譯詞 Chan,這則添補得以讓英語世界認識到,禪宗不是只有日本的 Zen,更有日本禪宗源頭的中國禪宗。

Photo Credit: 世界公民文化中心提供

我研究 OED 多年,常有學界的前輩、朋友問我,在這部英語世界的詞彙寶庫裡,究竟收錄了多少源自中文的詞語?網上有人說 120 個,有人說 200 多個,甚至有人說 1000 多個。數字差距如此懸殊,到底哪一個答案才對?

答案應該是官方說法的兩倍

2018 年 11 月 19 日,牛津大學出版社(中國)的詞典部總編輯劉浩賢 (Franky Lau) 出面,在接受媒體的採訪時表示,英國 OED 編輯部提供的數字是 250 個。

牛津英國總部的說法看似一槌定音,然而我卻半信半疑。胡適曾說,做學問要在不疑處有疑,於是我便在眾說紛紜之中,花了一週的時間,從早到晚密集研究。根據我得出的第一手資料,我的答案是 500 個左右,數字是 OED 官方說法的兩倍。

在回答問題前,請容我先把必要的背景說明一下。

如何統計英語詞典裡的中文字?

我在 2005 年曾經做過一個類似的研究,不過對象是規模較小、2 大冊的《牛津英語詞典簡編》(Shorter Oxford English Dictionary,簡稱 SOED)。這套 SOED 是 20 大冊完整版 OED 的節本 (abridgement),當年的統計數字是 250 個左右,詳細的詞表發佈在大陸的《廣東外語外貿大學學報》上。

如果有人認為,「2 大冊有 250 個中文詞語,20 大冊是 10 倍的規模,所以中文詞語的總數就是 2500 個」,如此推論就差之毫釐、謬以千里了,因為這不是個簡單的算術問題。簡編版的 SOED 保留了完整版 OED 大多數的詞語條目,只是在詞源、定義、書證等其他地方刪節壓縮。是故,欲知 OED 收錄了多少中文詞語,這研究還得從頭做起,無法貪快,沒有捷徑可走。

有幾個觀念也得界定釐清,否則這項研究無法進行。

判定標準一:源自中文,還必須是「漢語」

首先,什麼是源自中文的詞語?這問題看似容易,實則不然。根據大陸權威的《現代漢語詞典》所載,中文是「中國的語言文字,特指漢族的語言文字」。準此,OED 收錄的 Kalgan(喀拉干,河北省張家口的舊稱),用來指稱張家口特產的羊毛皮,因其源自蒙古語,我就覺得不該算。同理,OED 收錄的 Lhasa Apso(拉薩犬)源自藏語,也不能算是源自中文的詞語。然而,OED 收錄的 hutung(胡同,威妥瑪拼音)就得算,因為追本溯源,「胡同」雖來自蒙古語,唯其漢化已深,早已是漢語詞彙的堅定的一員。OED 也收錄了 Manchu(滿族;滿語),該詞雖源自滿州語,道理同上,也得算是源自中文的詞語。

實際的情況,有些並非這麼黑白分明。碰到棘手的例子,我只能運用我的專業知識,在幾分掙扎之後,逐一迅速下判斷了。

判定標準二:音譯、借譯才算外來語

另外,怎麼樣的中文詞語才算是英文裡的「外來語」?我認為「異化」較深的才算,這其中包含兩大類。其一是音譯詞(transliteration,即語音轉寫),如:

Photo Credit: 世界公民文化中心提供

其二是借譯詞(calque,即逐字翻譯),如:

Photo Credit: 世界公民文化中心提供

當然,這個部分在操作的時候,情況也沒有想像中的清楚明瞭,有時還得根據自身的認知加以取捨。茲舉數例。英文裡有些音譯詞最終來自中文,然而卻是透過其他語言進入英文的,如:

Photo Credit: 世界公民文化中心提供

我基於理性,把這類詞排除在外,但做這個決定時,心裡是有幾分痛苦和不平的。

英文有些依中文而造的借譯詞,結構、內容上並不夠嚴謹,如:

Photo Credit: 世界公民文化中心提供

碰到這種情況,我依照OED的詞源和定義,參考漢英詞語之間的吻合度,做出綜合判斷。「紅包」的red envelope和「燕窩」的bird’s-nest soup,此二者我把它們納入計算,視之為英文裡來自中文的借譯詞。

如果概念事物是中國的,但英文的對應是相對自由的意譯,我便傾向於將之排除在外,如:

Photo Credit: 世界公民文化中心提供

500個中文詞語,多數不親民

1989 年第 2 版的 OED 有 20 大冊,紙質詞典只能用於個別詞語的翻查瀏覽,無法做系統、深入的學術研究。最新的 OED 是個有償使用的超大型線上詞典,是個在第 2 版的基礎上整合更新而成的巨型電子資料庫。

身為 OED 的訂戶,我藉由官網上的進階搜尋 (Advanced search),配合地毯式的審閱與交叉求證,電腦、手動雙管齊下,按照上揭的原則,花了一週的潛心鑽研,終於整理出了最新的研究成果。《牛津英語詞典》,這個簡稱為 OED的英語詞彙終極寶庫,究竟一共收錄了多少源自中文的詞語?我的答案是,500 個左右。

說「左右」,是因為有一些我主觀判斷的成分,有一些我對衍生詞和複合詞的取捨,甚至我可能遺漏了部分詞語。

我對這個詞表的整體印象是,500 個左右的詞語中,大部分既冷僻又專業,反映了 OED 這個曠世巨著長久以來的體質。OED 於 1857 年正式啟動,迄今百餘年,是個早年英國文人醉心其中的計畫,內容以「高大上」著稱,近來雖調整了方向,儘量反映英語的全貌,試圖貼近庶民的生活,不過高大上的體質依舊。

*高大上:中國流行語,全稱「高端、大氣、上檔次」。

按類別來看,在來自中文的 500 個左右詞語裡,依數量多寡排列:

Photo Credit: 世界公民文化中心提供

哲學宗教 20 個左右、地方(特產)20 個左右、棋藝遊戲 15 個左右、歷史 15 個左右、情感表達 15 個左右、各色人等 15 個左右、音樂戲曲 15 個左右、朝代 15 個左右、商業貨幣 15 個左右、社會黑暗面 15 個左右、中醫中藥 10 個左右、布料服飾 10 個左右、植物 10 個左右、動物 10 個左右、武術健身 10 個左右,建築、度量衡、書法、自然物質 4 項均不足 10 個。

這是先有結果再行分門別類的,分類時也常碰到一些兩難的情況。比如地名,OED 收錄的地名幾乎都不是單純的地名,而是作為修飾語,用以表該地的歷史、語言、特產、風格等,因此在定其歸屬時僅能擇一而為,有時單純,有時只得武斷。

這個 500 詞表的體量偏大,本文難以容納,將於下一期完整刊出,敬請期待。


科技賦能創新突圍——愛酷智能科技舉辦 MarTech Salon,為企業創造數據驅動新價值

自 2018 年成立以來,愛酷智能科技深耕 AI 與 MarTech 領域,在行銷科技應用上擁有專業並豐富的實務經驗。MarTech Salon 系列活動旨在創造一個行銷科技交流平台,透過各領域講師及產業先行者的分享,協助企業掌握 MarTech 新趨勢,在數位新浪潮中搶得先機。
評論
圖片來源:愛酷智能科技
評論

愛酷智能科技於 9/29 (三) 舉辦今年第一場 MarTech Salon「用聊天機器人,輕鬆培養忠誠用戶!」,吸引數百位參與者共襄盛舉,包含中小企業主、品牌行銷人、行銷代理商等經理人。活動分享最新 ChatBot 對話式商務趨勢、顧客數據整合技術、會員標籤應用,並解析 AI 與 MarTech 的策略性思維。

圖片來源:愛酷智能科技

行銷 5.0 時代,One ID 科技賦能

行銷 5.0 的時代注重「技術」與「人性」融合的全方位戰略,打造更完善的顧客體驗 (CX, Customer Experience),加上面對資訊的爆炸,企業的痛點在於多渠道破碎資料整合的困難。

透過 One ID 整合消費者與品牌的互動歷程,企業能夠將匿名資料,即網路上的任何瀏覽行為,納入行銷決策的參考依據。愛酷商務解決方案暨夥伴關係經理 Perry Wang 在分享中提到:「One ID 技術追蹤本我、自我、超我外的第四個我,也就是『匿名我』。」

Perry Wang 舉房仲產業應用做進一步解釋,房仲市場成交的關鍵,在於業務服務的精準度,仔細發掘顧客真正的需求,推薦適合的物件。然而,過往消費者經常心口不一,難以取得真正的需求,透過愛酷 One ID 追蹤技術,能將顧客在網頁瀏覽的物件類型、地段、價格數據一次收整,隨著預約賞屋的名單,派送到業務手中,洞察顧客的行為,進而做到房產智慧推薦,提升成交機會。

運用聊天機器人,打造多元運用情境

「對話式商務」之所以能成為現今極具潛力與商機的行銷模式,原因在於品牌透過通訊軟體主動出擊,能創造與消費者間更多元的接觸點及對話機會。愛酷顧客成功經理 Wayne Chen 在講座中分享使用聊天機器人的六大目的:「聰明運用 ChatBot,將能夠提升行銷溝通效率,滿足『會員募集』、『增加品牌知名度』、『協助客服』、『搜集顧客意見』、『推播再行銷』、『引導購物』。」

活動中,來賓針對聊天機器人服務也萌生許多問題,包含如何評估 ChatBot 需求、需做哪些前置準備等。Wayne Chen 建議企業首先應思考創建聊天機器人的目的,例如:提高來客率、會員系統服務建置、業務轉型等;接著分析企業想搜集的資訊、提供給顧客的服務、用科技解決的行銷問題,進而透過創意活動培養忠誠用戶。

會員精準貼標,創造有效互動

投資對話式商務工具、透過創意增粉操作與用戶互動後,分群分眾與需求深度挖掘則是企業下一步應掌握的重點。愛酷行銷經理 Eason Huang 說明:「透過標籤系統,能逐層剖析顧客的行為輪廓,提升溝通內容的精準性。」愛酷智能科技協助顧客從命名規則著手,將標籤分成靜態、動態類型,並加入標籤層級的關係架構,以達到在對的時間,與對的人,溝通對的內容。

Eason Huang 進一步建議,企業在運用標籤系統與用戶互動時,應至少都包含「完善用戶輪廓」、「探勘用戶興趣」、「引導用戶行為」其一目的,「提升營收」僅是結果。不論是透過靜動標籤調查用戶喜好、推進用戶成為會員或是為了下一次的活動佈局,企業都應制定明確的目標以創造真正有效的互動。

從數據整合技術、聊天機器人應用到標籤深度規劃,愛酷智能科技分享 MarTech 最新趨勢,也透過成功案例說明企業如何在疫情下逆勢成長,培養忠誠會員,並達到會員導流,帶動營業額提升。

未來,愛酷智能科技將持續舉辦 MarTech Salon 系列活動,協助企業掌握 AI 與 MarTech 最新趨勢與應用。歡迎追蹤以下渠道,掌握最新資訊:

本文章內容由「愛酷智能科技」提供,經關鍵評論網媒體集團廣編企劃編審。