AI 在 Tech First 中读取被维苏威火山烧焦的古代卷轴

一名21岁的计算机科学专业学生赢得了一场全球竞赛,以阅读古罗马城市赫库兰尼姆(Herculaneum)碳化卷轴中的第一篇文字,该卷轴自公元79年火山喷发以来一直无法阅读 – 与埋葬附近庞贝古城的火山喷发相同。这一突破可以打开数百个文本,这些文本来自希腊罗马古代唯一幸存下来的完整图书馆。

内布拉斯加大学林肯分校的卢克·法里特(Luke Farritor)开发了一种机器学习算法,该算法在卷起的纸莎草纸的几行上检测到希腊字母,包括πορϕυρας (紫菜s),意思是“紫色”。Farritor 使用表面纹理的细微小尺度差异来训练他的神经网络并突出显示墨水。

“当我看到第一张图片时,我感到震惊,”意大利那不勒斯大学的纸草学家费德里卡·尼古拉迪(Federica Nicolardi)说,她是审查Farritor发现的学术委员会成员。“这真是一个梦,”她说。现在,“我实际上可以从卷轴内部看到一些东西。

公元 79 年 10 月,维苏威火山喷发将赫库兰尼姆留在 20 米高的火山灰下,埋葬了数百个卷轴。早期打开纸莎草纸的尝试造成了一团糟的碎片,学者们担心其余的碎片永远无法展开或阅读。“这些都是如此疯狂的物体。它们都被弄得皱巴巴的,“Nicolardi说。

维苏威火山挑战赛提供一系列奖项,朗读卷轴上的四段或更多段落将获得 700,000 美元的主要奖金。10 月 12 日,组织者宣布 Farritor 因在 4 平方厘米的纸莎草纸区域阅读超过 10 个字符而赢得了 40,000 美元的“首字母”奖。柏林自由大学的研究生优素福·纳德(Youssef Nader)获得第二名,获得10,000美元奖金。

豪华图书馆

最终看到卷轴中的字母和文字“非常令人兴奋”,意大利威尼斯大学古希腊和罗马历史学家西娅·萨默斯基尔德(Thea Sommerschield)说。这些卷轴是在十八世纪发现的,当时工人们发现了一栋豪华别墅的遗迹,该别墅可能属于凯撒大帝的岳父家族。Sommerschield说,破译纸莎草纸可以“彻底改变我们对古代历史和文学的了解”。今天已知的大多数古典文本都是抄写员几个世纪以来反复抄写的结果。相比之下,赫库兰尼姆图书馆包含直接从作者那里从任何其他来源不知道的作品。

到目前为止,研究人员只能研究打开的碎片。已经确定了一些拉丁文著作,但其中大多数都包含与伊壁鸠鲁哲学学派有关的希腊文本。有部分 关于自然,由伊壁鸠鲁本人撰写,由一位名叫菲洛德穆斯的鲜为人知的哲学家撰写,主题包括恶习、音乐、修辞和死亡。有人认为,图书馆可能曾经是他的工作收藏。但有600多卷卷轴——大部分保存在那不勒斯国家图书馆,少数在英国和法国——仍然完好无损,未被打开。在别墅的较低楼层仍然可以找到更多的纸莎草纸,这些纸莎草纸尚未被挖掘出来。

计算机科学家布伦特·西尔斯(Brent Seales)帮助建立了维苏威火山挑战赛,他和他的团队花了数年时间开发方法,使用X射线计算机断层扫描(CT)扫描“虚拟解开”消失的薄层,并将它们可视化为一系列平面图像。2016年,在列克星敦肯塔基大学(University of Kentucky in Lexington)的西尔斯(Seales)报告说,他使用这种技术阅读了以色列恩格迪(En-Gedi)烧焦的卷轴,揭示了利未记(犹太律法书和基督教旧约的一部分)的部分内容,写于公元三世纪或四世纪。但是En-Gedi卷轴上的墨水含有金属,因此在CT扫描时会发出明亮的光芒。较旧的赫库兰尼姆卷轴上的墨水是碳基的,基本上是木炭和水,扫描密度与它所在的纸莎草纸相同,所以它根本不会出现。

Seales意识到,即使亮度没有差异,CT扫描也可能捕捉到纹理的微小差异,从而可以区分涂有墨水的纸莎草纸区域。为了证明这一点,他训练了一个人工神经网络来读取打开的赫库兰尼姆碎片的X射线图像中的字母。然后,在 2019 年,他将两幅完整的卷轴从巴黎法兰西研究所带到英国牛津附近的同步加速器 X 射线设施 Diamond Light Source,以迄今为止最高的分辨率(每个 3D 图像元素或体素 4-8 微米)扫描它们。

大约 1,500 个团队很快就通过游戏进行讨论和协作er 聊天平台 Discord。奖品是分阶段设计的,当达到每个里程碑时,获奖代码就会发布,供所有人使用。Farritor一直对历史感兴趣,从小就自学拉丁语,很早就参与其中。

与此同时,Seales的团队还进行了虚拟拆包,发布了扁平碎片的图像供参赛者分析。一个关键时刻出现在6月下旬,当时一位参赛者指出,在一些图像上,肉眼偶尔会看到墨水,这是一种微妙的纹理,很快就被称为“噼啪声”。Farritor立即将注意力集中在噼啪声上,寻找进一步的字母暗示。

八月的一个晚上,他正在参加一个聚会,突然收到一个警报,说一个新的片段已经发布,特别明显的噼啪声。通过手机连接,他在新图像上运行了他的算法。一个小时后,他走在回家的路上,掏出手机,看到屏幕上有五个字母。“我上蹿下跳,”他说。“哦,我的天啊,这真的会起作用的。”从那时起,我们只花了几天时间就完善了模型,并确定了奖品所需的十个字母。

纸草学家也很兴奋。在打开的赫库兰尼姆卷轴中还没有读到“紫色”这个词。紫色染料在古罗马非常抢手,由海蜗牛的腺体制成,因此该术语可以指紫色、长袍、买得起染料的人甚至软体动物的等级。但比单个单词更重要的是阅读任何东西,Nicolardi说。这一进展“使我们有可能恢复整个卷轴的文本”,包括标题和作者,以便可以识别作品并确定日期。

看到看不见的东西

伦敦谷歌DeepMind的研究科学家Yannis Assael将维苏威火山挑战赛描述为“独特而鼓舞人心”。但他指出,这是更广泛转变的一部分,人工智能(AI)越来越多地帮助研究古代文献。例如,去年,Assael 和 Sommerschield 发布了一个名为 Ithaca 的 AI 工具,旨在帮助学者收集身份不明的古希腊铭文的日期和起源,并提出文本建议以填补任何空白。现在,它每周都会收到数百个查询,类似的努力也适用于从韩语到古代美索不达米亚使用的阿卡德语的语言。

Seales希望机器学习能够打开他所谓的“隐形图书馆”。这是指实际存在但没人能看到的文本,包括中世纪书籍装订中使用的羊皮纸;palimpsests,其中后来的文字掩盖了下面的一层;和纸箱,其中旧纸莎草纸的碎片被用来制作古埃及木乃伊盒和面具。

然而,就目前而言,所有的目光都集中在维苏威火山挑战赛上。大奖的截止日期是12月31日,西尔斯将这种情绪描述为“肆无忌惮的乐观”。例如,Farritor已经在卷轴的其他部分运行了他的模型,并看到了更多的角色出现。

本文经许可转载,并已 首次发布 在2023年10月12日。

本文由AI快讯网译自:AIMagazine

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 2023年 10月 12日 下午8:40
下一篇 2023年 10月 17日 下午8:30

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!