風向往哪吹 AI 都知道!從台大誕生的語意分析團隊藍星球,推出輿情監測平台「蛛思 CHOOSE」

藍星球副總經理宋浩博士提到,近年英文語意分析以 NLP( Natural Language Processing,自然語言處理 )為主,奠基於英文變化少而固定的文法來理解句子。但同樣的方法應用在中文語意分析表現卻不如預期。
評論
▲藍星球副總經理宋浩博士,photo credit: 藍星球
評論

人工智慧讀寫文章早已不稀奇,聯合利華等國際公司早就使用能讀懂文章的語意分析 AI 來幫忙整理人類根本看不完的履歷,而華文 AI 分析因其商機龐大,不斷吸引中國廠商、跨國外商的競相投入,但因華文文法結構複雜、難度極高,市場仍屬戰國時代。由 臺灣大學官方入股藍星球資訊 今天舉行產品發表會,以臺大正式技術轉移、臺大資工碩博士為研發核心, 百分百臺灣新創團隊自主研發 華文人工智慧演算。

發表會現場展示  「透事 THOUGHTS」華文探勘分析系列技術以及「蛛思 CHOOSE」輿情智慧分析平台兩項產品。透事主要由藍星球提供 6 項技術工具,為自有大量資料的客戶量身打造特殊需求的語意分析 AI,並取代人力,從雜亂的資料中統整出各種有意義的分類、報告、資訊、摘要等等。蛛思則是將技術整合成平台,提供媒體、行銷等需要搜羅外部資訊的客戶一目了然的報表、摘要、關鍵字、競品比較等等應用。

藍星球資訊從 1996 年台大負責的數位典藏計畫開始,為中央政府提供服務,到 2013 年成立藍星球資訊、2016 年開始擴張客群到現在已經累積了 20 年的繁體華文處理經驗。

藍星球副總經理宋浩博士提到,近年英文語意分析以 NLP ( Natural Language Processing,自然語言處理 ) 為主,奠基於英文變化少而固定的文法來理解句子。但同樣的方法應用在華文語意分析表現卻不如預期。宋浩博士認為華文語意分析碰到了瓶頸,就是因為沿用 NLP 基礎,但華文組合多變,他舉例全「台大」停電和「全台」大停電,這兩句都可能是對的,還要加入前後文才能判定語意,用 NLP 截出詞語來組合就容易錯誤。藍星球的技術則是大詞優先並挑出關鍵字拼湊語意,他認為這才是跨過華文語意 AI 撞牆期的方法。 

目前演算前導技術已應用於藍星球目前客戶專案,包含臺北市政府、外交部、文化部、華藝數位等重要機關企業,在去年營收就已經打平。蛛思資訊來源除了涵蓋現在台灣的新聞,明年 Q2 預計加入台灣網路社群、Q3 進軍中國新聞、Q4 更要納入中國各大社群。

宋浩認為,台灣面對中國市場競爭本身有繁轉簡多字對一字的優勢,反之簡體一字常常能對應到數個意義不同的繁體字,較容易失真。另外他也提到,中國也有語意分析團隊想直接訓練繁體 AI,卻因資料量過大遭網路長城阻擋,反而台灣這邊能夠讀取中國資訊,訓練中國在地話詞庫更為方便,這些都是台灣團隊的優勢。

現在藍星球團隊技術成員占一半,宋浩博士表示目前仍持續徵才中,非技術部分主要為專案經理,技術人員方面則需要專案工程師、產品工程師,以及鑽研語意 AI 核心技術的研發工程師。

目前團隊中有七到八成都是碩士,大部分來自台大,宋浩坦承跟國外搶人才確實不容易,但是團隊中多為剛畢業的學生,都是為了開發語意 AI 的共同願景而留下,現在也持續徵才,明年希望團隊能擴張到 50 人。


【一圖看懂】民生基礎建設的資安防禦為何重中之重?ACW SOUTH 沙崙基地打造天然氣、石化、變電所三大測試場域為大眾保駕護航

這幾年的新冠疫情、俄烏戰事奪走許多寶貴生命,讓網路流行一句「你的歲月靜好,是有人為你負重前行。」當我們能夠安居樂業過著恬靜生活,其實是仰賴一群人在社會各個角落堅守崗位,多數人才能享受無虞的生活及安全的家園。
評論
Photo Credit:TNL Brand Studio
評論

我們在食衣住行許多方面皆與水、電、天然氣等資源息息相關,在高度數位化的現代,臺灣在面對這些資源的基礎建設時,網路安全的防禦為何比其他國家更需謹慎面對?這件事可以從俄烏戰爭獲得啟發。

Photo Credit:TNL Brand Studio

從俄烏戰爭居安思危,臺灣每月面臨 4000 萬次的網路攻擊

有人說如果有一天真的發生第三次世界大戰,那一定會發生在網路上。從近期的俄烏戰爭來看,除了使用傳統槍砲坦克,更值得注意的是雙方都派出大量 IT 駭客,攻擊對方的油水電重要基礎建設的伺服器、通訊設施,企圖阻斷即時資訊,藉此癱瘓敵方的民生設備運作。

事實上,一般駭客不會主動攻擊一個國家的基礎建設,大多是鎖定企業等級為目標,像是美國燃油管線營運公司,受到來自東歐的勒索病毒攻擊,被迫暫停營運同時還要支付新台幣 1 億 4,000 萬元的贖金,造成當地民眾恐慌,發生一波搶購燃油熱潮。

而臺灣因為政治戰略的因素,外部駭客總是虎視眈眈,想要癱瘓我國的民生關鍵基礎設施。過去幾年間臺灣每月平均受到 2,000 萬到 4,000 萬次外來攻擊,甚至懷疑一起大型惡意軟體攻擊,幕後的駭客是有國家力量在撐腰。

臺灣民生建設資安防禦迫在眉睫,ACW SOUTH 沙崙基地扮演關鍵角色

身為島國的臺灣,電力、石油、天然氣及水利等資源設備,是供應國內經濟發展及民生需求的重要資產。面對各項能源設備資安的防護,我國經濟部長王美花過去就曾公開表示,「油電水等關鍵設施假使被破壞,後果不堪設想,所以資安是重要基本功,一定要發展做好防護措施。

身為國內首屈一指的「ACW SOUTH 沙崙資安服務基地」(以下簡稱 ACW SOUTH 資安基地),承接起重責大任,提供資安實驗場域,模擬攻防演訓及產品驗測服務;也會邀請資安服務廠商與工控營運業者到沙崙場域,進行實作的技術交流。

ACW SOUTH 資安基地計畫團隊表示,「透過資安服務商與工控營運業者的交流分享,有助促進產業對於工控資安了解與場域運用;同時我們也會辦理工控資安等相關課程、研討會及交流會,鏈結資安與工控業者幫助雙方有更深入的技術合作。」

目前 ACW SOUTH 資安基地的「關鍵基礎設施工控場域」主要有「石化/化工、天然氣及變電所」三套系統,模擬五套攻擊劇本,協助相關基礎設備的管理者,在受到攻擊當下知道該如何反應,及早因應強化資安防禦實力。萬一遭遇偽造工作站監看數據、偽造命令操控電磁閥和空壓機、電驛傳輸通訊中斷等攻擊事件,就能立刻啟動應變流程。

走訪 ACW SOUTH 資安基地關鍵基礎設施,了解三大測試場域功能有多強

場域一、石化基礎設施
2020 年臺灣兩大石化公司接連傳出資安攻擊事件,部分資訊系統感染勒索軟體病毒,造成加油站的支付系統停擺,導致消費者付款機制受到影響。

ACW SOUTH 資安基地提供的化工模擬製程實體運作機櫃,是全台首座「石化/化工製程水位控制平台」,模擬情境為一般化工反應槽連續式循環水流水位控制,以水為循環流體模擬,可提供研究測試與訓練使用、自主開發攻防情境。來現場測試的業者,可透過視覺式監控介面與 DCS 收集現場監測儀表的即時資訊,做到收集完整數據紀錄及警報,具體測試資安防護設備與解決方案。

場域二、天然氣基礎設施
美國一家天然氣壓縮公司曾經受到勒索軟體攻擊,駭客透過魚叉式網釣攻擊入侵 IT 網路,再找機會滲透到 OT 網路,並在這兩個網路部署勒索軟體,導致人機介面、伺服器完全失能,公司業務被迫停擺兩天。

ACW SOUTH 資安基地的儲槽氣體壓力監控系統,模擬情境為天然氣廠氣體儲槽壓力,使用空壓機模擬天然氣體,當氣體壓力高於或低於警報值時,系統畫面警示工作站主機,並同時記錄數據變化、警報和事件。

場域三、變電所基礎設施
2021 年台電董事長說台電遭駭客攻擊幾乎每天發生;俄烏戰爭過程,俄羅斯駭客也曾嘗試對烏克蘭發電廠下手,利用資料破壞軟體發動攻擊,藉此癱瘓高壓變電所,讓烏克蘭當地無電可用。

電力系統無論在發電、輸電及配電的任一部分發生故障,都有可能影響整個供電系統異常,因此保護電驛的作用就在及早隔離故障,避免影響到後續的相關設備。ACW SOUTH 資安基地的保護電驛監控系統採用 IEC61850 標準來進行網路通訊,可用來監視、記錄電驛突發事件,藉此模擬變電所遭受攻擊的危機處理。

要讓臺灣關鍵基礎設施免於駭客襲擊,可說是天方夜譚,但我們能做的是提升資安、強化防禦韌性,更有餘裕時間來防禦或補救攻擊。ACW SOUTH 資安基地的關鍵基礎設施,目前打造了三大測試場域,擁有可實際演練的攻防腳本,並進行資安產品的驗測。

ACW SOUTH 資安基地深知臺灣以製造業起家,尤其近年半導體領域成為舉世聞名的護國神山;另外因應全球淨零碳排議題,綠能也是前景可期的重要產業。因此在 ACW SOUTH 資安基地除了有關鍵基礎設施,還設計智慧製造、智慧綠能、半導體及物聯網等主題,可為相關業者做攻防演訓及產品驗測,有助提升我國整體資安防禦力。

「經濟部工業局 廣告」