【Wired 硬塞】AI 找筆跡發現:死海古卷是由兩位抄寫員共同完成的!

多數學者認為大以賽亞書卷是由同一人抄寫下來,但最新的筆跡研究卻推翻了這個看法。
評論
Photo Credit:Reuters/達志影像
評論

原文來自 Wired《AI Helps Prove Two Scribes Wrote Text of a Dead Sea Scroll》,作者 Jennifer Ouellette。台灣康泰納仕集團授權提供,由 Amber Peng 翻譯並經 INSIDE 編審。

大部份的死海古卷(Dead Sea Scrolls)都沒有署名,所以無法知道是由哪位抄寫員謄寫的,而且學者也很難根據字跡的特徵辨認某份手稿是由一位,還是多位抄寫員完成。但是,根據《PLOS ONE》期刊最新發表的文章,大以賽亞書卷的研究加入人工智慧的技術後,科學家發現該手稿應該是由兩位抄寫員共同完成,而且其中一位還試圖模仿另一位的筆跡。

如同我們之前的報導,這些希伯來抄本(完整和零散的手稿加起來約有 900 份,都保存在泥罐裡)分散在死海北部庫姆蘭定居點附近的各個洞穴中,最早由生活於此的貝都因人在 1946 至 1947 年間發現。(故事應該是這樣,一名牧羊人在找一隻走失的羊時,亂丟一顆石頭,剛好擊中一個泥罐,就發現了書卷。)

羅馬人約在西元 73 年時摧毀了庫姆蘭定居點,歷史學家相信愛賽尼派 (Essenes)的文士為保護這些手稿因而將它們藏在洞穴中,因為洞穴中的環境條件和天然石灰岩,手稿可以保存千年以上不是問題。這些手稿可以追溯至西元前 3 世紀到西元 1 世紀之間。

某些手稿已經用放射性碳定年法和同步輻射法分析過,這些技術可以讓科學家了解這手稿裡筆跡的特徵。一名以色列科學家歐朗.奧柏曼(Oren Ableman)則是在 2018 年時將紅外線顯微鏡連接電腦,用來分析從 1950 年代就一直保存在香菸盒裡的書卷碎片。

2019 年一項「聖殿書卷」的研究則指出這些抄本表面帶有一些特殊的硫酸鹽類(像是硫、鈉、石膏、鈣),這可能是這些文本能完整保存的原因。而去(2020)年,科學更發現了收藏在曼徹斯特大學裡的四份書卷竟然藏有文字,內容很可能是以聖經西結書裡的經文,原本學界都以為這些書卷是空白的。 

最近的研究聚焦在「大以賽亞書卷(編號 1QIsa)」,這是在庫姆蘭洞穴 1 發現的書卷之一,也是在洞穴發現的所有文本中,唯一被完整保存的書卷,只有一小部份的表皮脫落了。這份書卷共寫在 17 張皮紙上,總長約 732 公分、寬 25 公分,包含了聖經以賽亞書的全部內容,因此大以賽亞書卷被公認為是近一千年來發現最古老、最完整的手抄本。(以色列博物館和 Google 合作了一項死海古卷計畫,將以賽亞書卷數位化並加上英文翻譯。)

多數學者認為以賽亞書卷由同一位文士抄寫而成,因為字跡看起來相當一致,但也有少數學者認為是由兩位文士各完成一半的書卷,只是一方模仿了另一方的筆跡。該 AI 研究的共同作者,荷蘭格羅寧根大學的教授麥拉登・波波維奇(Mladen Popović)表示:「科學家試著找出決定性的證據來證明筆跡出自同一人,或不同人之手,比如某個特定字母的特徵。」波波維奇同時也是格羅寧根大學專門研究死海古卷的庫姆蘭機構的院長。

Dead_Sea_Scrolls
Photo Credit: iStock
死海古卷。

傳統認筆跡的方式都是非常主觀的,都是靠專家的個人經驗。這門學問其中一個困難處在於,每位抄寫員的書寫方式不可能一模一樣,因此很難判定筆跡來自同一人的細微變化,或是兩個筆跡很像的人。更麻煩的是,不同人也可能有相同的書寫方式,因為他們接受了相同的訓練。或同一人也可能因為疲倦、受傷、使用不同書寫工具等等的原因而改變字跡。

波波維奇表示:「人眼是很厲害的,可以把以上因素都考量進去。專家可以判斷筆跡來自不同人之手,但是無法明確告訴你他的判斷依據。另外,讓專家消化書卷裡的海量資訊幾乎是不可能的。」其中一個希伯來字母「Aleph」在整份大以賽亞書卷至少出現了五千次,用人眼比對這五千個字母根本不可能,但波波維奇認為人工智慧和特徵辨識的技術正可以解決這個難題。

首先,波波維奇和他的同仁藍伯特・舒馬克(Lambert Schomaker),以及碩士學生馬魯夫・戴利(Maruf Dhali)開發了一個人工神經網絡,用來訓練電腦將字跡和皮紙或是莎草紙分開(或稱二元化),以確保數位影像捕捉到所有的筆跡。舒馬克表示:

「完整保存字跡是很重要的,因為古代墨水的痕跡直接與人的肌肉運動有關,所以是非常個人化的。」

接下來他們製作了一張 12 x 12 全形「Aleph」和「Bet」字母的圖表,他們認為在文本當中所有形狀相似的圖案為同一個字母。這張圖有助於研究筆跡的變化,但是比起一個完整的字母本身,片段的字跡更能讓研究人員得到有力的結論。

最後發現,該書卷來自兩人之手,就算研究團隊將雜訊加到影像裡做進一步的驗證,得出實驗結果仍是一樣的。研究甚至指出,儘管兩人的筆跡很像,但是其中一人的字體變化比較大,這可能代表兩人受到同樣的訓練。

最後波波維奇的團隊製作了一張用來做視覺分析的「熱點圖」。他們把書卷裡出現的所有 Aleph 字母抓出來,根據前 27 列和後 27 列的字母分別產生一個均化的 Aleph 字母,最後產生的兩個字母透過人眼就可以很清楚看到差別,也就代表書卷的第二部份是由不同人抄寫而成的。

波波維奇表示:

「與其以前靠印象的方式,現在我們用電腦以量化分析和統計分析的技術可以證明書卷是由不同人抄寫而成了,而且還能證明兩人的筆跡有顯著的不同。」

但是該研究仍不完全排除字跡的差別可能是因為抄寫員累了、受傷、使用不同的書寫工具的可能性,只是「該書卷由兩位抄寫員完成」是比較直截了當的解釋。研究人員也表示,這項研究證明了筆跡的研究若能和其他領域合作,將有許多益處。接下來,研究人員想將此技術應用到其他死海書卷的研究上。

提到這項發現的重要性時,波波維奇表示:「我們現在有能力辨認出不同的抄寫員了,雖然我們無法知道他們名字,但透過他們的筆跡,感覺我們終於能和他們握手交流了。」

責任編輯:Chris
核稿編輯:MindyLi

延伸閱讀:



疫情停課不停學、地震前拋簡訊 台灣如何用數位科技打造「智慧國家」

在地震、大雨前夕,手機敏捷地出現示警簡訊;在家遠距上班、上課,有賴於順暢網路 ⋯⋯ 這些看似再日常不過的生活環節,背後基礎都緊扣著「智慧國家」推動的政策藍圖。台灣被評比為「全世界四大超級創新國」、也被肯定是全球前 5 的 「2020 全球創新潛力」,在過去 4 年是如何深耕邁向具有創新能力、宜居的「智慧國家」?台灣人民又是如何看待這座「數位島嶼」?
評論
Photo Credit:Unsplash
評論

打開手機、掃描 QR code、發送簡訊,這不到 30 秒的步驟,讓「簡訊實聯制」成為台灣人民抗疫的重要環節。繼去年口罩實名制後,簡訊實聯制的快速整合,不僅吸引日本 NHK 媒體報導,更顯示了台灣基礎數位建設與應變實力。事實上,台灣自 2016 年起推動「數位國家、智慧島嶼」的目標,短短 4 年內已有成果,吸引 Google 在台擴大資料中心投資計畫,同時,台灣微軟、亞馬遜 AWS 接連來台駐點。到底是哪些數位政策,讓台灣持續邁向「智慧國家」?對照其他國家,台灣又有什麼獨特之處?

疫後時代比拚數位實力》對照星、韓 看見台灣數位政策亮點

以鄰近國家新加坡為例,2014 年推出「智慧國家 2025」計畫,協助中小企業與人民「數位化」,並打造逾 9 成的網路滲透率,積極邁向全球首個智慧國家的目標。伴隨 Covid-19 疫情的擴散,意外促使「零接觸經濟」發酵,新加坡看準趨勢推出「攤販數碼化轉型計畫」(Hawkers Go Digital),補助地方的小攤小販們改採 QR code 形式結帳,藉此加速整體社會的數位轉型腳步。

此外,韓國也看見國家帶頭數位化的重要趨勢,於 2020 年規劃 8大領域的「數位新政」(New Deal),積極布局 5G、AI 等產業,像是自駕車技術運送病患、AI 即時病情診斷等數位創新方案,能在未來即時協助民生需求。

台灣在過去 4 年深耕「數位實力」,像是 2019 年推出全球第一輛自駕公車,解決偏遠地區的大眾運輸成本高、人力不足的痛點;以及同年推出全球第 2 個可將災害訊息快速發送「手機災防告警訊息」服務,整個過程不到 1 秒,目的是為了盡可能爭取逃生秒數、降低受傷人數。

再以各國相當重視、也是數位發展根基的「基礎數位建設」為例,台灣的高速寬頻服務涵蓋率(1Gbps)已達 90%,隨手都可連上 iTaiwan 無線上網服務,甚至是連 481個原鄉部落都設置 i-Tribe 無線網路服務。這不只是彌平城鄉的「數位落差」,更協助桃園復興區、台東金峰鄉帶動農產品的網路行銷、產值提升。

日常生活有感!見證「數位島嶼」一步步落成

當數位政策走進生活,台灣民眾又有什麼樣的感受?根據關鍵議題調查中心的調查(註),最有感、最感興趣的便是「數位環境基礎建設完善」,普遍認為 iTaiwan 熱點上網的普及率高,相當滿意;並且不分性別年齡族群,都期待網速、熱點數量的提升。

Photo Credit:關鍵議題調查中心
台灣民眾普遍認為 iTaiwan 熱點上網普及率高,相當滿意。

不只如此,順應防疫需求,許多在地店家都自主加入「行動支付」的行列,進一步推動數位經濟發展,調查中也顯示,民眾相當滿意金融科技、數位商務的發展。不過,台灣 16~34 歲男性族群,多普遍認為「生技醫療」應為最為優先投入「數位創新」,其次才是「資訊科技」,顯示疫情時代下,民眾對於生技醫療「數位創新」的期待更深。

Photo Credit:關鍵議題調查中心
台灣民眾相當滿意金融科技、數位商務的發展。

不過全球推動數位政策的趨勢中,如何把關、互通資料的標準,一直是數位治理的重點。以新加坡為例,主打只要一支手機,就能搞定轉帳付費、查詢最佳路況、掛號預約醫院等食醫衣住行育樂行為。但公民的隱私安全如何掌控,卻成了難解的爭議難題,對此,台灣民眾對於資料開放與互通標準,認為應有更多的公開透明與課責。

Photo Credit:關鍵議題調查中心
台灣民眾認為應有更多的公開透明與課責。

除此之外,在台灣不斷推展數位政策下,教育部的線上教學便利包,在「停課不停學」中措施扮演關鍵角色。在公私協力合作下,打造出豐富的線上學習資源平台,再加上網路的普及,不論是偏鄉、都市的學童,只要有一台電腦,就可在家運用線上資源,讓資訊能無時差地、無身份地差別走進各個家戶內,以平衡城鄉差距及實踐「數位平權」。同時,弱勢族群面臨的數位落差也逐漸消弭,像是社會企業「若水國際」的引入下,身障者也能任職科技產業,實際落實每位公民擁有相等使用數位的權利,落實數位平權的發展。

準備好支持未來十年發展!智慧國家已啟航

值得注意的是,調查中發現,台灣多數民眾期待台灣早日成為智慧國家,以提升個人生活品質與國家的國際競爭力;不過現階段僅 1 成民眾表示熟悉智慧國家的相關政策,顯示多數民眾仍不太熟悉、政策無法直接與個人生活福祉有所連結。

不過,這也是台灣推動「智慧國家」政策未來 5 年(2021-2025)的重要目標,舉實例來說,從公務機關的辦理作業全面數位化開始,期待於 2025 年達成 100% 導入「 MyData 取代紙本臨櫃核驗」機制;同時,與新加坡的智慧國家相似,為了支持中小企業持續數位創新,將協助投入資安與數位商業模式的導入,加速數位轉型、數位經濟的發展。

而人才的培育也得跟上數位趨勢,因此 5G 基礎建設、海底電纜建設的完備缺一不可,才能進一步全方面推動 5G 教育,期待能在 2025 年建立 10 個 5G 校園應用實作場域,藉此為國內培育優秀的 5G 人才。

儘管疫情的到來,意外推升了全球對於數位轉型、數位發展的需求,但以防疫面向來看,像是自駕車來運送須待隔離的病患;或是運用 AI 即時判斷病情,得以疏散醫療資源的使用,又或者是透過無人機配送貨物等數位化應用,更加強化了科技防疫存在的必要與重要性。這場疫情刺激韓國、新加坡強化「智慧防疫」的意識,更是說明了台灣深耕、投入「智慧國家」的方向,確實踏上了重要的趨勢道路。

行政院科技會報辦公室 廣告

  • 註解:本文內民眾對數位政策滿意係依台灣 16-65 歲的網路使用人口結構進行調查,自 110 年 4 月 29 日起至 5 月 13 日止,採用線上網路問卷調查有效樣本數共 754 份,在 95% 信心水準下,其抽樣誤差介於 ±3.57% 之間。