三維X射線顯微鏡(顯微CT)與人工智能結(jié)合解讀歷史謎團(tuán)
發(fā)布日期:2024-04-28 14:47:00

以下文章來源于布魯克X射線部門



據(jù)Nature的這篇報(bào)道,一個(gè)由三名學(xué)生組成的研究團(tuán)隊(duì)利用人工智能技術(shù)成功解讀了2000年前維蘇威火山爆發(fā)時(shí)被掩埋的赫庫蘭尼姆卷軸上的內(nèi)容(見下圖)。這次研究首次揭露了一篇討論感官和愉悅的未知古希臘哲學(xué)作品,標(biāo)志著運(yùn)用AI技術(shù)解讀古代文獻(xiàn)新時(shí)代的開始,這可能對(duì)我們理解古代世界帶來重大影響。

點(diǎn)擊鏈接查看原文:https://www.nature.com/articles/d41586-024-00346-8



2000年來首次讀出的赫庫蘭尼姆古卷中的文字[1]

這篇報(bào)道是近期關(guān)于AI技術(shù)眾多報(bào)道中并不顯眼的一篇,我們可能還在感慨ChatGPT4在自然語言處理方面的強(qiáng)大,在討論Sora生成的視頻如何逼真,而在科研領(lǐng)域AI已經(jīng)成為一種強(qiáng)大的工具,并且可以與其他先進(jìn)的技術(shù)相結(jié)合,幫我們打開“死結(jié)”,將過去的不可能變成可能。


我第一次聽說碳化古卷,是2016年在布魯克舉辦的顯微CT全球用戶會(huì)上。來自美國(guó)的Seth Parker介紹了他們團(tuán)隊(duì)新穎的工作,使用顯微CT和虛擬展開技術(shù),將可追溯到公元600年的碳化古卷展開,并根據(jù)CT圖像的襯度信息提取卷軸中的文字。這也是三維X射線顯微鏡與虛擬展開技術(shù)的第一次聯(lián)手,成功識(shí)別了碳化卷軸上的文字,并經(jīng)研究人員解讀判斷為《摩西五經(jīng)》,希伯來圣經(jīng)的經(jīng)典之一。


左圖為研究人員將卷軸放入SkyScan1173中準(zhǔn)備掃描。中圖為碳化卷軸,右圖為虛擬展開后的卷軸CT圖像[2]


在此之前,這項(xiàng)工作只能依靠精細(xì)的手工,利用特殊的機(jī)器,讓卷軸緩慢打開,而第一個(gè)卷軸的展開就花費(fèi)了大約4年的時(shí)間。更為挑戰(zhàn)的是,這樣的展開無法重復(fù),如果失敗,就會(huì)對(duì)樣品造成無法挽救的破壞。所以, 19世紀(jì)以來,考古研究者們停止了對(duì)碳化古卷的打開。直到大視野高分辨率的顯微CT出現(xiàn)在人們的視野,取代了人工和特制的機(jī)器,提供了無損揭開卷軸的技術(shù)。鑒此,Seales教授團(tuán)隊(duì)與布魯克展開了深入的合作,利用布魯克的高分辨率三維X射線顯微鏡,重啟了古卷展開的研究工作,也就有了前文Parker介紹的創(chuàng)新性的成果,他們的研究成果也發(fā)表在了Science上。
布魯克SkyScan高分辨率CT和虛擬展開技術(shù)結(jié)合的成功,使得古卷研究者們野心勃勃。但是當(dāng)他們將這種方法直接用于赫庫蘭尼姆古卷內(nèi)容的讀取時(shí),卻遇到了新的困難。赫庫蘭尼姆古卷是使用碳制墨水在由埃及出產(chǎn)的紙莎草紙上的,碳墨水與紙張的成分接近,對(duì)X射線的吸收系數(shù)接近,無法根據(jù)CT圖像的稱度信息直接讀取紙卷上的內(nèi)容。

▲碳化的赫庫蘭尼姆卷軸,圖片來源:維蘇威火山挑戰(zhàn)賽

然而,此時(shí)正逢深度學(xué)習(xí)、人工智能的熱浪席卷全球,計(jì)算機(jī)算力的提高,高效的神經(jīng)網(wǎng)絡(luò)模型的提出,再一次讓Seales教授的團(tuán)隊(duì)看到了解決問題的希望,他們可以利用前人留下的卷軸碎片,結(jié)合深度學(xué)習(xí)方法,從X射線CT圖像中讀取看不見的信息。 

▲圖片來源:維蘇威火山挑戰(zhàn)賽


方法有了,但是問題的解決并非一蹴而就。2023年3月,Seales 與硅谷投資者 Nat Friedman(發(fā)起人和贊助商)、Daniel Gross(贊助商)和 JP Posma(項(xiàng)目負(fù)責(zé)人)一起,在證明人工智能可以成功解析碳化卷軸信息后,發(fā)起了一場(chǎng)解讀碳化卷軸的全球競(jìng)賽-維蘇威火山挑戰(zhàn)賽。

▲Seales和Friedman維蘇威火山挑戰(zhàn)賽的發(fā)起人,贊助人之一。[3]

維蘇威火山挑戰(zhàn)賽設(shè)有多個(gè)獎(jiǎng)項(xiàng),獎(jiǎng)金總計(jì)100萬美元,其中大獎(jiǎng)獎(jiǎng)金70萬美元,要求在2023年12月31日前解讀出兩卷赫庫蘭尼姆卷軸中至少4個(gè)單獨(dú)的段落,并且每個(gè)段落至少包含140個(gè)連續(xù)字符,每段中缺失或無法辨認(rèn)的字符不超過15%。來自柏林的Youssef Nader(一名埃及生物機(jī)器人研究生),他領(lǐng)導(dǎo)的團(tuán)隊(duì)(包括SpaceX 實(shí)習(xí)生、內(nèi)布拉斯加州的大學(xué)生Luke Farritor和來自蘇黎世的機(jī)器方向大學(xué)生Julian Schilliger)在眾多競(jìng)爭(zhēng)者中脫穎而出,獲得了大獎(jiǎng),團(tuán)隊(duì)分享了70萬美元的獎(jiǎng)金。
生活在人工智能快速發(fā)展的今天,我們何其有幸,善用這個(gè)強(qiáng)大的工具可以事半功倍。不過使用人工智能不能是“練仙丹”,原料喂進(jìn)去,產(chǎn)出隨天意。要想得到可靠的結(jié)果,需要使用人員具備足夠的辨別能力,還需要強(qiáng)大的科學(xué)儀器提供可靠的數(shù)據(jù),比如,Seales教授團(tuán)隊(duì)選擇的布魯克公司的高分辨率三維X射線顯微鏡。

注:

[1]https://uknow.uky.edu/research/grand-prize-discovery-made-2000-year-old-herculaneum-scrolls

[2]https://www2.cs.uky.edu/dri/herculaneum-papyrus-scrolls/

[3]https://zh-cn.futuroprossimo.it/2024/02/vesuvius-challenge-abbiamo-dei-vincitori-e-i-primi-testi-decifrati-dai-papiri/