Google MUM 語言模型已訓練 75 種主要語言

在 Google I/O 2021 期間提出的「MUM」模型確定會應用在 Google Search
評論
評論

本篇來自合作媒體 Mashdigi,INSIDE經授權轉載。

今年在 Google I/O 2021期間, Google 分別宣布兩種語言模型「LaMDA」 (Language Model for Dialogue Applications),以及「MUM」 (Multitask Unified Model),藉此詮釋未來在人機互動上的想像。而 Google 搜尋研究員暨副總裁 Pandu Nayak 在線上訪談中,更具體解釋「MUM」背後運作原理,以及未來預計應用發展方向。

讓系統以更全面形式判斷使用者提問內容

按照字面上解釋,「MUM」是由「Multitask Unified Models」三個字縮減為稱,主要會分析字句中的關鍵內容進行比對,而不是僅作全面比對,因此與現行應用在 Google Search 的 BERT、GPT-3 模型採不同運算模式。

以先前在 Google I/O 2021 舉例內容來看,當使用者說明先前已經完成在亞當斯山的徒步旅行,接下來希望嘗試挑戰富士山,若是以往的語言模型判斷結果,可能就會直接顯示富士山相關資訊,讓使用者自行檢視相關搜尋內容。

但在「MUM」語言模型運作下,系統會從使用者的描述中抓出關鍵比較條件,例如使用者已經去過亞當斯山,並且是以徒步旅行方式完成,因此會以此條件作為基礎,進而與場景換成富士山,同在相同徒步旅行的條件下作比較,不會出現相同場景卻有比較條件基礎不一樣的情況。

另外,由於「MUM」會進一步讓系統了解人類語言結構與文字在不同情況下所代表意義,而非只是進行文字上的條件理解判斷,因此在互動過程中會記下先前提問內容,讓系統能在符合前因後果情況下正確回答問題。

因此當使用者在後續互動中提到計畫秋天時啟程,同時也透過拍攝登山靴照片詢問是否適合穿著使用時,系統就會透過畔對先前提及計畫前往富士山的條件,進而查詢富士山過去在秋天時的氣候狀況,並且透過影像識別判斷使用者所拍攝的登山靴,是否適合在富士山徒步旅行使用,避免出現錯誤判斷情況。

讓機器了解人類語言是相當大的挑戰,將以「MUM」精進 Google Search 搜尋結果

目前 Google 已經累積訓練 75 種主要語言,藉此建立「MUM」語言模型,並且透過多路流程讓系統分析判斷使用者藉由文字、影像或語音等方式搜尋需求,進而找出最佳解答。在過程中,分別會透過第一個步驟了解語言背後含意,進而在第二步驟中透過東路流程進行判斷,最後一個步驟則是深入了解使用者希望查找內容,並且提供合適答案。

不過,光是第一個步驟就會面臨極大挑戰,比方目前對應新型冠狀病毒的 17 款疫苗,至少就透過 50 種語言以超過 800 種名稱稱呼,其中輝瑞疫苗或莫德納疫苗均有不同稱呼方式,但是都是指相同疫苗,因此要在短時間理解判斷使用者所指內容細節,並且能讓使用者快速找到正確內容,勢必要改善現行 Google Search 背後使用語言模型。

而透過「MUM」語言模型支援跨語言移轉知識能力,即可讓系統快速對應不同語言,並且尋找相同內容結果,就像使用者同時精通多國語言,可以透過不同語言詮釋相同內容,不會因為使用語言差異讓詮釋結果截然不同。同時,在系統學習全新語言之後,可直接與已經學習知識建立連結,無需重新學習,更凸顯「MUM」語言模型持續擴充彈性。

「MUM」不會取代現行使用語言模型,亦可學習無文字語言

Pandu Nayak 強調「MUM」不會取代目前使用的 BERT、GPT-3 語言模型 (至少目前不會),而是會以強化形式讓 Google Search 更能理解使用者在搜尋過程所指內容。

而對於無法透過文字傳遞的語言,Pandu Nayak 則說明目前建構語言模型所使用數據,其實不僅是文字內容,同時也包含影像、影片及聲音等內容,透過大量數據關聯之下,同樣也能讓「MUM」順利建構語言模型。

與「LaMDA」鎖定不同應用形式,但都會改變現有人機互動

至於跟先前同樣在 Google I/O 2021 期間提出,同樣也是讓系統了解人類語言的模型「LaMDA」,則是會更聚焦在對話式的互動,例如讓紙飛機或冥王星能以擬人形式與人「對話」。但相比「MUM」確定會應用在 Google Search,「LaMDA」目前仍處於試驗階段,因此暫時未有明確應用規劃。

從 Google 今年提出兩種語言模型來看,其實可以更明確看見 Google 希望讓使用者更容易透過 Google Search 找到正確解答的發展方向,並且能創造全新人機互動體驗。

不過,目前包含「MUM」在內語言模型僅會用在 Google Search,暫時沒有對外開放使用計畫。

責任編輯:蜜雅
核稿編輯:Anny

延伸閱讀:



疫情竟使童婚比例暴增?2023 年前將新增 400 萬女童被迫成婚

全球有無數女童正在面臨貧窮、家暴、性別暴力、失學的困境,在動盪不安的 Covid-19 威脅下,女童遭受的生命危機更勝以往,而你我都不該漠視。立即加入世界展望會的資助兒童計劃,不再讓悲劇發生。
評論
Photo Credit:世界展望會
評論

在新冠疫情、武裝衝突的影響下,阿富汗女性與兒童正面臨重大威脅,不僅人身自由、教育、工作等權利備受衝擊,近期更傳出 12 歲女童被強擄配婚給軍人的消息,使當地長期存在的「童婚」問題更加嚴重。事實上,不只是阿富汗,全世界仍有無數女童深陷在不安與恐懼中,面臨童婚、童工、貧窮,以及女性割禮等殘酷傳統文化等挑戰,這一關又一關的生存考驗,只因為她們是女生。

女童困境恐怕比你想像的嚴重——關於性別暴力、童婚

根據聯合國統計,每年有 1,200 萬未成年女童結婚,她們大多是因為民間習俗或經濟弱勢而被迫成婚,婚姻不僅逼迫這些女童放棄學業,其遭受家暴的風險也將大增,甚至被迫從事性行為,使得尚未發育完全的身體備受負擔;許多未成年少女因為懷孕或分娩併發症死亡,嬰兒胎死腹中或夭折的機率也更高。

來自緬甸的 17 歲少女荷拉(Hla)就曾是性別暴力與未成年婚姻的受害者。在她12歲時,一場重病帶走了她的母親,而酒精成癮的父親根本顧不了這些孩子,因此荷拉被迫離家、在街上討生活。為了尋求避風港,荷拉甚至嫁給了大她 15 歲的男子,並在 14 歲成為一名母親,但生下孩子沒多久後,丈夫便另尋新歡,留下荷拉和孩子相依為命。無助的荷拉為了不讓孩子跟著吃苦,只能忍著思念的痛苦,把孩子送到安置機構。

Photo Credit:世界展望會/荷拉小時候常跟著爸媽到各個城市的慶典或嘉年華活動兜售玩具,並以此維生。然而非常微薄的收入,根本無法支撐荷拉與 13 個兄弟姊妹的生活。

幸好在荷拉最低潮的時刻,遇上了世界展望會。在世界展望會的協助下,除了支持荷拉重建身心健康,也提供她職業訓練的機會,培養一技之長。僅管有些髮廊仍因荷拉的經歷而不願接受她,但在世界展望會的引薦下,現在的荷拉已找到一份穩定的髮廊實習工作,每月都能賺取 20 美元的薪水,並和同事們住在一起、彼此照顧。從街頭遊童到髮型設計師,荷拉因為世界展望會出現在她的生命中,而有了希望。

Photo Credit:世界展望會/荷拉說:「我住在街頭時,常常受到男性的輕蔑和不尊重。即使我根本沒有做錯事,也常常得躲避警察取締,生活充滿恐懼和不安。很感謝世界展望會的幫助和支持,我才能把自己的人生拉回正軌,創造更好的未來。」

女童困境恐怕比你想像的嚴重——關於失學、文盲、童工

荷拉的故事絕不是少數案例。事實上,許多女童不只遭受可怕的性別暴力,也因為貧窮或環境動盪,而被迫放棄受教育的權利,成為失學的童工,甚至不得不從事對身心發展有害的勞動工作。根據聯合國資料,全球童工人數在疫情的影響下,20 年來首次增加至 1.6 億;而全球約 7 億人口的文盲當中,女性就佔了 2/3。困在社會底層的弱勢女童,身心備受煎熬,急需你我關注。

印度女孩珊蜜拉,便是弱勢女童的縮影之一,遭遇令人心疼。珊蜜拉(化名)原本是個熱愛上學的女孩,14 歲時由於家中經濟無法負擔她繼續升學,因此被送到孟買與姊妹們一起工作,幫助家中生計。當時,珊蜜拉請妹夫幫她找工作,沒想到卻是噩夢的開始,妹夫將她送到人口販子手上,珊蜜拉被推入妓院工作,並經歷長達三個月地獄般的生活。

「只有我工作了才會有飯吃。如果我不工作,妓院老闆、甚至是客人就會拿皮帶打我。我被迫喝酒、他們會拿菸燙我的手。我一直在哭,求他們放我回家。」後來珊蜜拉得知自己陷入險境是受親人所害,整顆心都碎了。

Photo Credit:世界展望會/珊蜜拉好不容易說出那段記憶:「我經歷的那些,希望沒有其他任何女性需要經歷。我承受了非常多的痛苦,那是一段很難熬的時期。白天會有 12 到 14 個男人,晚上則會有 15 到 16 個。一整天工作完後,所有的女孩會被送到荒郊野外中的一棟建築物裡休息,整間房間裡只有一扇窗戶。因為太偏遠,即便我們大吼著求救,也沒有任何人會聽到。」

終於有一天,珊蜜拉和其他女孩們的工作場所遇到警察臨檢,珊蜜拉便趕緊抓住機會向警方求救。成功獲救的同時,同樣在場的妹夫和妓院老闆也遭到警方逮捕。接著,珊蜜拉花了數個月的時間輾轉換了好幾間避難所,最後終於回到家人身邊。

在家人的陪伴以及世界展望會的支持下,珊蜜拉終於踏上復原之路。由於人口販運的受害者往往受到許多暴力與虐待而留下嚴重陰影,這段遭遇遂成為她們心中無法說出口的痛,且大多數受害者因地處偏遠、經濟貧困,或是覺得丟臉、自責等心理因素,難以取得身心重建的專業支持。因此,世界展望會提供包括創傷後症候群、焦慮、憂鬱、恐慌、斯德哥爾摩症候群、藥物濫用等醫療與心理照護,讓更多像珊蜜拉一樣遭遇創傷的女童,得以重建生命。

Photo Credit:世界展望會/珊蜜拉現在加入了印度世界展望會的受害者支持團體,踏上了復原之路。

你有力量打破女童困境:資助 1,000名 女童,扭轉 1,000+ 個家庭命運

在 Covid-19 的疫情衝擊下,脆弱國家的資源更加緊縮,這也讓兒童面臨前所未有的考驗。世界展望會的分析報告指出,2020 年 3 月全球疫情爆發後,與 2019 年相比,童婚案例在許多社區暴增了一倍以上;而童婚的增幅速度,更攀升到25年來最高,若無法改善,預估 2030 年前全球將再增加 1000 萬名兒童新娘。

對於女童而言,貧窮、家暴、性別暴力、失學等問題是無法分割的,這些威脅往往彼此連動、加乘,為女童的生命帶來嚴重打擊。但從上述的實際案例可以發現,受困女童的命運並非不能扭轉,只要世界上某個角落的某一個人願意付出行動,女童的生命就有希望曙光。

世界展望會推動「資助 1000 個女童 挺聲而進 願景無懼」行動,期待在 10 月 11 日女童日前,能為 1000 個女童找到資助人,每個月 700 元,就能翻轉一個女童的生命,為她提供安穩的生存環境與受教權,並將這份改變延伸至女童的家庭與周遭社區,帶來正向影響力。讓我們一起阻止女童悲劇再次發生,現在,就加入改變世界的行列!