多語神人分享開發心得!Duolingo 新增中文課程,幕後推手竟然是日本工程師

向 Duolingo 的中文課程說「你好」!
評論
▲ ,photo credit: Duolingo
評論

本文為 Duolingo 投稿的開發心得,作者為語言學習服務 Duolingo 負責中文課程專案的工程師 Masato Hagiwara,專長為自然語言處理(NLP)精通中、英、日語並正在學習韓語和邏輯語(Lojban,一種人工語言)。同時也是 O'Reilly 知名著作 《Natural Language Processing in Python》 和 《Machine Learning for Hackers》 的第一譯者。

英文原文同步刊登於 Duolingo 官方部落格,INSIDE Mia 獲授權編譯。

向 Duolingo 的中文課程說「你好」!

2017 年 11 月 16 日,Duolingo 正式對外發表了用英文學中文的課程,並同步在 iOS、Android 和網頁平台推出。在 Duolingo  5 年的歷史中,中文和日文都算是最多人想要新增的語言之一。這倒也不意外,畢竟全世界有超過 10 億中文人口。這不僅對我們來說是個重要里程碑,更讓世界上數百萬人能用免費、有趣又有效的方法學習中文。

學中文的挑戰

根據美國外交學院(Foreign Service Institute),中文對美語母語者來說落在 最難學的等級 ,他們估計要達到精通,得花上 88 週(或 2200 小時)上課,而且該課程的整個第二年都待在中國,要的就是讓學生沈浸在中文環境裡。

不過別怕,若要學習基本或更進階的中文,只要使用 Duolingo 就行,不用花上數千小時或去中國待上幾年。

我們教什麼、如何教?

我們課程教的是「普通話」(Modern Standard Mandarin ,現代標準華語),是官方語言,在中華人民共和國(中國)和中華民國(台灣)都可以通,也是新加坡和緬甸的官方語言之一,而且從馬來西亞到美國,多國的華人都會使用。

不論是母語或第二外語,全世界有超過 10 億人會說中文,也就是說你隨機從世界上挑一個人,有七分之一的機會是懂中文的,其廣度沒有其他語言能出其右。

既然中文應用這麼廣,我們想確保開發出來的課程能愈有效率愈好,特別是針對初學者。以下就是我們具體的作法:

練習四種聲調

Photo credit: Duolingo
Photo credit: Duolingo

中文是種聲調語言,這代表它會用音高的變化來表達不同的詞語,而主要的聲調有 4 種。

要說明聲調如何影響意義,我們拿「ㄕ」(Shi)來舉例。扁平的一聲「ㄕ」可以代表獅子,音調上升的「ㄕˊ」可以代表「石」頭,低沈的「ㄕˇ」則能用在歷「史」,音調向下的「ㄕˋ」就代表「是」(to be),這幾個意思可是天差地遠。事實上,同樣的聲調組合甚至還有不同的對應意義,你甚至可以光用不同聲調的「ㄕ」寫出一首詩,比如《石氏嗜獅》。

也因為聲調在中文扮演相當重要的角色,如果想有效地溝通,就得熟練運用這些聲調。

學習上千個中文字形

中文「字」本身就是書寫的基石,同時也是世界上最古老的書寫系統之一,並且時至今日仍在使用中。和英文字母不同,中文字是 表語文字(象形)為主,它們代表的是意義,而不只是發音。也就是你得學會成千上百個文字,才能正常地書寫中文,這絕對是學中文最困難的因素之一。

我們的中文課程會教你如何辨認和唸出將近 1000 個常見重點中文字,為了達成這個目標,我們將已經應用在 日文韓文 的新文字練習功能發揮到極致。除了學到近 1000 個中文字,過程中你還會學到標準中文拼音系統之一的「漢語拼音」。

Photo credit: Duolingo
Photo credit: Duolingo
Photo credit: Duolingo
Photo credit: Duolingo
Photo credit: Duolingo
Photo credit: Duolingo

其實不是所有中文字系統都一樣:在中國大陸、新加坡和馬來西亞等地,寫的是簡體中文;而在台灣、香港、澳門等地則主要使用正體中文。由於大部分中文使用者兩種文字都看得懂,所以使用 Duolingo 學中文的使用者還是能在台灣和香港使用,不過我們之後也會加入正體中文課程。

1000 個文字、1000 組詞

我們的中文課程包含超過 1000 組詞彙以及近 1000 個字,涵蓋 HSK(漢語水平考試,中國官方中文程度測驗)1-3 級的詞庫和文法,甚至包含第 4 級所需一半的內容。這代表課程大約是進階初學者程度,以國際標準 CEFR (歐洲共同語言參考標準, Common European Framework of Reference for Languages) 而言,等級大約是 A2 的程度。

而且,這門課還是有研究支持的:我們的課程安排是根據一項以 CEFR 為基準的標準架構, EBCL (歐洲漢語能力基準項目, European Benchmarking Chinese Language Project) 為中文學習者訂定主題和情境,以及檢定程度與敘述能力。完成課程後,你應該能自我介紹、談論日常生活話題(工作、校園、家人、天氣、感受等等),能夠在說中文的國家旅行、在餐廳訂位、購物殺價,以及更多的應用。

這門課中所有的教學都是建立在美食、旅遊等情境上,取代了「動詞補語」或「過去分詞」這類強調文法的概念,完成這些情境課程後,使用者就能學到融合單字與文法的應用。

情境式教學和一些 bonus

Photo credit: Duolingo
Photo credit: Duolingo

我們的語言專業團隊仔細地檢閱了開放的中文字語文法清單(比如 HSK 公布的清單),最後,為了反映現在的中文用法,我們加入了大量的新內容。

課程教學本身依照打招呼、職業、健康、運動等等主題情境打造,除此之外,我們還提供了一些額外的 bonus 主題,包括:

  • 食物:上完課後你會學到怎麼點珍珠奶茶、炒飯、饅頭等。
  • 旅遊文化:你會學到「大熊貓」、「中國萬里長城」這些到中國旅遊一定很實用的詞。
  • 節慶:你會學到「新年快樂!」好迎接即將到來的狗年。
  • 網路用語:你可以學到一些用在朋友身上的詞,比如「可以用微信聊嗎?」
  • 商業金融:既然中國是商業金融匯聚重鎮,學習商業應用及專業用語對很多人來說有幫助。我們的課程提供一套實用且正宗的商業相關課程,會教一些像是「我傳給你的合約看了嗎?」,「我們想投資你的公司。」之類的句子。

不論你是出於興趣、挑戰或著教育、專業目的學中文,這個課程都會以有效又有趣的方式幫你從各種面向學習這個語言。

最後,沒有這些夥伴的貢獻就沒有這套課程,感謝  Sasha-O, crush, foshhh, Lynn_Mo, Ontalor, wangster25, Yue.T-C  和 Z.Shan

我們希望你能享受上這門課,就如同我們非常享受創造這門課一樣!

謝謝(xie xie)- thank you!

延伸閱讀:


遊戲進軍海外市場,使用者體驗外更要注重用戶隱私安全

近年來遊戲產業蓬勃發展,但也同時引來了大量的 DDoS 攻擊。除了提供遊戲玩家良好流暢的遊戲體驗,防範惡意攻擊也是遊戲產業發展的重點項目。
評論
評論

隨著科技日新月異、加上新冠肺炎席捲全球,大家「宅在家」的時間也越來越長。也就是說,人們需要花更多時間,透過網路與線上的各項服務,滿足自己工作、學習、娛樂等需求。

Photo Credit: Akamai

然而,這同時也代表著各類線上或網路的服務將面臨更多安全攻擊。據統計,光是 2020 年,全球的勒索軟體攻擊事件就增加了 715%,網路釣魚攻擊增加了 600%,上半年 DDoS 攻擊事件也增加了 151%。

遊戲產業,已成 DDoS 主要目標之一

對於遊戲產業來說,本來可以借著網路的蓬勃發展,將服務擴廣至到全球市場,不過也必然會在安全和用戶體驗等方面遇到更多挑戰。舉例來說,阻斷服務攻擊(DDoS)是一種常見攻擊方式,並已成為遊戲產業所面臨的最主要攻擊方式之一。根據 Akamai 威脅研究人員在 2019 年 7 月至 2020 年 6 月期間的調查,發現了超過 3000 起針對遊戲產業的 DDoS 攻擊!

Photo Credit: Akamai

面對 DDoS 攻擊,玩家遊戲體驗大受影響,遊戲廠商收入和品牌聲譽受到損害,你該如何應對?

Akamai 幫你有效緩解

要想守護遊戲安全,需要遊戲公司、遊戲玩家共同承擔責任,單打獨鬥很難應對海外攻擊的大幅增長。對此,Akamai 將 Prolexic DDoS 與 IP Protect 技術相結合,通過簡單有效的方法保護資料中心內所有以 Web 和 IP 為基礎的應用程式免受 DDoS 攻擊,減少停機時間,幫助遊戲廠商為玩家提供提供沉浸式遊戲體驗,提升玩家黏著度,提高企業營收,保護品牌信譽。

面對 DDoS 攻擊的企業將能通過 Akamai 清洗中心重定向網路流量,只允許乾淨的流量轉發,從而有效抵禦 DDoS 攻擊。同時 Akamai 安全營運指揮中心(SOCC)的專家還可協助客戶量身打造主動破解的控制措施,以便即時發現並有效阻止攻擊,並對其餘流量進行即時分析,作為擬定下個階段因應措施的參考。

Photo Credit: Akamai

Prolexic 的主動破解控制如今已經可以「零秒」抵擋超過三分之二的 DDoS 攻擊,並以業界領先的破解時間 SLA 為後盾,為客戶的線上服務提供完全託管的 DDoS 防護服務,快速緩解大規模、即流量來到 TB 等級的 DDoS 攻擊。

案例分享:Smilegate West的 玩家體驗革新之路 

在南美和北美地區排名第一的遊戲發行商 SmilegateWest 透過自家的遊戲平臺 Z8 Games 發行了很多廣受歡迎的線上遊戲,該公司也是「穿越火線(CROSSFIRE)」在美洲、歐洲以及中東和北非地區的代理。對於這樣的一個遊戲平臺,Smilegate West 的收入和聲譽高度取決於其所營運線上遊戲的速度和穩定性,因此他們非常重視 DDoS 攻擊。

作為一款大受歡迎的第一人稱線上射擊遊戲,穿越火線在全球的玩家數量始終維持在數百萬人之多。雖然該遊戲可以免費遊玩,但大量忠實玩家也非常願意透過付費獲得更好的武器、防禦克貝以及其他有助於提高成績和排名的裝備。

談到遊戲的營運思維,Smilegate West 資深 IT 基礎架構和安全經理 Arash Haghighi 說:「在類似穿越火線這樣的遊戲中,速度和快速的決策能力非常重要,有時候甚至 1 毫秒的延遲也會對玩家得分產生負面影響,斷線的後果更為嚴重。我們希望玩家盡可以獲得最佳的遊戲體驗,因此降低延遲並提供穩定可靠的網路,一直是我們最重視的目標。」

Photo Credit: Akamai

Haghighi 負責了該公司在全球部署的多個資料中心,需要確保無論有多少玩家,IT 基礎架構都能為穿越火線以及其他遊戲提供快速、穩定的遊戲體驗。然而頻繁遭遇的 DDoS 攻擊成了 Haghighi 最頭痛的問題。尤其是現今的 DDoS 攻擊無論是在規模或是複雜性等方面都有了明顯的增長,且遊戲產業已成為攻擊者眼中的重要目標。洶湧而來的攻擊很容易就會讓伺服器徹底崩潰,瞬間影響數千名玩家。他們甚至遇到了一些更有針對性的攻擊,可以通過增加延遲的方式讓某些玩家在對戰過程中更具優勢。

「當玩家在玩某款遊戲遇到糟糕的體驗後,他們會非常積極地透過論壇和社群向全世界大肆宣傳,這很可能導致我們的市場佔有率被競爭對手搶走。」Haghighi 對於這種問題有極大的感觸。

行雲流水般的,無懼 DDoS 威脅

近些年,Smilegate West 一直在 Akamai 的幫助下有效抵擋 DDoS 攻擊,確保能為全球玩家提供流暢的遊戲體驗。尤其是在 Akamai Prolexic Routed 的幫助下,他們甚至成功緩解了最大規模、最複雜的攻擊。

借著 Akamai 雲端 DDoS 抵擋服務的容量和威脅情報,Smilegate West 成功抵擋了巔峰值流量超過 400 Gbps 的攻擊,並瞬間恢復了正常運作。

Akamai 工程師 24/7 全天候分析流量模式並提供新篩檢程式的做法也讓他們更具信心。

在透過 Akamai 安全營運回應中心(SOCC)及時回應最新威脅的同時,他們還可以通過一個專用的帳戶密切監視各項網路活動,並針對諸如封包丟失、延遲、連線品質等關鍵指標獲得即時資訊。

Photo Credit: Akamai

為全球化營運保駕護航

DDoS 攻擊可能來自全球任何一個角落,而 Akamai 遍佈全球的 20 個據點可以有效阻止攻擊流量進入 Smilegate West 的資料中心。由於該公司玩家遍佈全球,每年還會在巴西、加拿大、中國、埃及、土耳其和美國等地舉辦多場比賽,因此 DDoS 抵擋服務的規模和覆蓋範圍也就顯得更加重要。而無論 Smilegate West 將業務拓展到哪裡,都可以獲得 Akamai 的妥善保護。

同樣借助 Akamai 遍佈全球的雲端,Smilegate West 還可以在 CDN 加速、遊戲下載和更新速度以及邊緣交付等領域獲得巨大價值。對玩家來說,這意味著遊戲和更新的下載速度更快,遊玩體驗也有了進一步提升。

在此基礎上,Smilegate West 也進一步加深了與 Akamai 的合作,開始借助 Akamai 的 Web Application Protector 解決方案為遊戲後端系統提供安全防護。

 

我們與 Akamai 的關係並不僅僅是客戶與提供商,而是朋友和夥伴。
——Arash Haghighi,Smilegate West 資深 IT 基礎架構和安全經理

歡迎訪問 Akamai 官網,了解更多行業案例及資訊。

本文由「Akamai」提供,經關鍵評論網媒體集團廣編企劃編審。