Meta 再度開源 AI 語言模型!「一言不漏」 直譯 200 種語言

「NLLB-200」是一套不經由中介語言、支援 200 種語言直接互譯的的翻譯模型。Meta 表示,對比先前的研究,這套最新的模型可以提升 44% 的翻譯品質,尤其是部分非洲與印度系語言的精準度更提高了 70% 以上。
評論
Photo Credit:META AI(Website)
評論

世界上有多少種語言?根據國際標準 ISO 639-3 的統計,包含方言全世界已有超過 7000 種語言被確認。科技的力量必然還力有未殆,但平台業者 Meta 對於征服語言再次展現雄心,6 日宣布,將開源 2 月發表「No Language Left Behind(不遺漏任何語言)」專案計畫的 AI 語言模型「NLLB-200」。並將提供 20 萬美金獎助金給採用這套模型的研究人員或非營利組織。

Photo Credit:META AI

「NLLB-200」是一套不經由中介語言(例如先將中文翻譯成英文、再由該英文結果翻譯成其他語言)、支援 200 種語言直接互譯的的翻譯模型。Meta 表示,對比先前的研究,這套最新的模型可以提升 44% 的翻譯品質,尤其是部分非洲與印度系語言的精準度更提高了 70% 以上。

科技媒體 The Verge 引用德國慕尼黑大學計算語言學(computational linguistics)專家 Alexander Fraser 說法,「其最主要的貢獻在數據,重點在於有『100 種全新語言』(被該模型支援)」。許多商業工具不支援的低資源語言(low-resource languages),也就是少於百萬人口使用的語言。而這是「NLLB-200」試圖處理的最主要課題。

Meta 在該專案的 AI 科學家 Angela Fan 表示,這個模型也將應用在支援維基百科(Wikipedia)的編輯者將編輯項目翻譯成其他語言。另外,開發該模型所使用的技術,很快的也會整合進 Meta 的翻譯工具。

儘管 The Verge 的報導也提及一些低資源語言使用者的擔憂,認為若透過科技生成更多低資源語言的文本(例如維基百科或其他教育文本),可能會影響到該語言的使用者自行用自己的語言建置文本的動力。但總體來說,Alexander Fraser 教授表示,「Google、Meta 以及 Microsoft 等公司都致力於低資源的機器翻譯(machine translation),這是一件好事。」

Meta 認為,建構一個可以支援多國語的技術,對於人們在元宇宙有重要意義,因為「沈浸式體驗有助於民主化」、「可讓全球更多人進入到元宇宙」。

該模型使用 Meta 於 1 月發表、與 NVIDIA 共同開發的超級電腦「AI Research SuperCluster(RSC)」進行 Training。

核稿編輯:Chris

加入 INSIDE 會員,獨享 INSIDE 最精采每日趨勢電子報,未來還有會員專屬內容。 點擊立刻成為會員

延伸閱讀:



新國科會主委吳政忠:部會協力串聯,打造不只科技部的科技,回應社會多元需求

國家科學及技術委員會揭牌及主任委員布達儀式 7 月 27 日於科技大樓舉行,原科技部部長吳政忠出任首任主任委員,承接過去使命再提出四點精進方向,期待透過跨部會協力,布局新興科技與產業。
評論
Photo Credit:TNL Brand Studio
評論

科技部改制為「國家科學及技術委員會」(以下稱「新國科會」),7 月 27 日於科技大樓舉行揭牌及主任委員布達儀式,與會貴賓不只涵蓋產官學界,總統蔡英文及行政院長蘇貞昌也親臨會場,共同見證我國科研事務推動最高權責機關成立,為政府組織改造立下重要的里程碑。

Photo Credit:TNL Brand Studio

新國科會打造不只是科技部的科技,建立科技與臺灣社會的多元聯繫

臺灣的科技不應該只有科技部,而是還有經濟部、衛福部等所有部會在一起,但是用科技部的名稱出去國外,好像就變成全臺灣的科技都是科技部的。所以我說,科技不會只有科技部的科技,應該是所有部會的總合。

新國科會首任主委吳政忠在致詞開頭即強調「部會合作」的組織核心,表示「科技不只是科技,科技與經濟、社會、環境等面相都有密切的關係」,也因此不應侷限於某個部分,應當是多個部會、學術界、產業界等攜手合作推動。

有別於過去科技部與行政院科技會報辦公室以合作關係來協調部會,未來新國科會改以委員會的組織形式運行,透過每月主要部會的首長共同商議策略方向,能夠整合部會資源,協作共達目標,此舉不只立下我國科技發展全新的里程碑,也讓臺灣能夠更靈敏的面對國際競爭。

Photo Credit:TNL Brand Studio
新國科會主委 吳政忠。

新國科會前身是 1959 年行政院國家科學委員會,又於 2014 年改制為科技部,過去肩負推動全國整體科技發展、支援學術基礎研究,以及發展科學園區等三大使命,在歷任部長的努力下,更將創新創業加入推動目標。如今的新國科會不只承接過去使命,主任委員吳政忠更提出以下四點未來新國科會所精進的方向:

一、跨部會協力,布局新興科技與產業
儘管臺灣小、科技預算不如國外,但臺灣部會之間高效率、精準連結的合作模式,將成為與國外競爭時的最大優勢,而「跨部會」溝通不只是未來新國科會的努力目標,也是新國科會最核心的思考架構。

二、基礎學術研究奠基
回顧過去兩年臺灣新冠疫情的防疫成果,無論在病毒醫學還是疫苗研發領域,基礎科學研究一直都是技術開發的堅強後盾;所以在臺灣邁向國際頂尖的路上,無論半導體、太空、還是人工智慧,科技的基礎研究與國際互動都將是新國科會注重的發展方向。

三、打造精緻多元的生活科學園區
過去半導體產業已替臺灣打下堅實的基礎,科技園區的產值從 2.7 兆成長到去(2021)年 3.7 兆,但除了半導體,其他的產業也需要布局,尤其是精準健康、智慧農醫、電動車、太空科技、低軌衛星等「接近生活」的重點產業。

四、實踐科技的人文社會價值
隨著科技與生活拉近距離,未來的科技發展必然需要與社會需求、環境永續連結,回應外在社會環境的變化;此外,科技人才培育、加強臺灣女性在科技面的投入比例,都將是未來新國科會欲強化的目標。

Photo Credit:TNL Brand Studio

進一步探究,就會發現上述新國科會的策略方針並非憑空發想,而是源自對產業發展的細微觀察與豐富的知識、經驗的珍貴結晶。早在吳政忠任職行政院科技顧問組副執行秘書時,就已觀察到「當科技更接近生活,產品價值就會大幅度的翻倍成長」的現象,再回顧臺灣善於代工製造零件的發展歷史,才萌生「將臺灣強而有力的製造技術與創新想法整合」的初步想法。

但是「整合」一詞的背後,需要的是基礎研究、應用研究,產業實務之間的環環相扣,過程不只涉及公私跨部門、跨領域的協調,也是一個漫長轉換的過程,並非一蹴可及。最後,在數年醞釀及無數人的共同努力下,儘管過程困難重重,以「部會合作」思考為核心的組織架構「新國科會」終於順利誕生,讓整體國家的科技發展得以提升至行政院層級的高度,向下整合上中游的基礎研究、下游的應用研究及產業實務的連接,創造更多的商機與價值。

Photo Credit:TNL Brand Studio

新國科會的挑戰與期許,後疫情時代的科技人文關懷

如今全球進入後疫情時代,國際關係變動不定,更面臨供應鏈重組、數位轉型等產業挑戰,科技作為國家發展重要的中堅力量,勢必需要更快速的布局因應,在變動中搶得先機。但除了研究與創新,科技與人文社會的結合也是新國科會的一大核心。

隨著人工智慧、太空等科技發展,生活中科技將無所不在,因此未來傳統產業必然將被完全翻轉,此時人文社會科學就扮演嫁接技術與生活文化的重要橋樑,彰顯科學研究成果對人類福祉的巨大貢獻。但這一切的前提是科技與社會必須主動伸手,彼此接觸、相互了解,攜手促進社會總體的福祉發展。新國科會成立之日,同時也是「國科會職場互助教保服務中心 [ 註 ] 」揭牌日,便能看見國科會對人文的用心,除了前述四大重點外,對於女性人才的培育、原住民教育的深耕、環境永續,都將是國科會的重點目標,如何透過科技連結社會的需求,正是新國科會追求的核心,因此新國科會不只是部會整合、資源分配與未來展望而已,更是將科技應用在民間的推動者,同時成為科技與人文交流的平台,最大化科技對總體社會福祉的貢獻。

國科會科技辦公室 廣告


[ 註 ] :國科會職場互助教保服務中心於 110 年 8 月開辦,位於科技大樓 1 樓,是臺灣公共托育協會承接的第一間職場教保中心。以平價、優質、非營利、社區化之方向營運,希望透過政府與公益法人團體協力的方式,結合民間團體資源,提供孩子優質的教保品質,減輕社區家庭照顧負擔,提升教保人員工作環境與權益。資料來源:財團法人彭婉如文教基金會