解密600年前的秘密,科学家利用AI成功破译“伏尼契手稿”第一句

唐旭 编译整理 量子位 出品 | 公众号 QbitAI

1912年,一份残余240页、从头至尾由未知文字与奇异插图写成的手稿在罗马附近的一所耶稣会大学图书馆中被波兰书商伏尼契(《牛虻》作者艾捷尔·丽莲·伏尼契的丈夫)发现并买下。

伏尼契手稿

碳十四测年法推定,这份手稿写成于15世纪初;但对于手稿的作者,没人能给出确切结论。手稿中的文字无法对应世界上任何一种已知语言,同时配有大量类似于植物、裸体人物以及天文符号的怪异图画;手稿从左至右书写十分流畅,没有明显的错误、修改痕迹甚至标点符号;同样地,没有任何类似密码对应的线索。

后世将这份神秘的手稿称为“伏尼契手稿”。无数密码学家、密码破译者乃至一战、二战中的情报人员在其面前束手无策。自“伏尼契手稿”被发现至今,无人能对手稿内容作出令人信服的解释。

简而言之,一本“天书”。

但最近,阿尔伯塔大学教授、自然语言处理专家Greg Kondrak和他的研究生Bradley Hauer宣称,运用人工智能,他们已经找到了破译“伏尼契手稿”的线索。

他们发现,“伏尼契手稿”上的文字实际上是古希伯来语,而且文字的排布有固定规律可循。

Kondrak称,研究的第一步,是找出手稿内容所使用的语言。为了达到这个目的,他们先让AI学习了以380种不同语言书写的《世界人权宣言》文本,以建立模式。在算法识别语言的准确率达到97%之后,AI对于“伏尼契手稿“进行了分析,判断文本内容有较高概率由加密过的希伯来语写成。

Kondrak和Hauer对此十分吃惊,在研究之初,他们本以为手稿中的文字是阿拉伯语。

“这很令人意外。”Kondrak在一份声明中说。“当然,告诉大家‘这是希伯来语’只是第一步,下一步要做的是搞清楚如何才能破译它。”

第二步,研究者们对于前人提出的一种假说进行了验证——有人认为,“伏尼契手稿”的文本规则其实是依照字母表排列顺序的异位构词法(举个例子,在此规则下,APPLE就会被转换为AELPP,BANANA就会变成AAABNN)。在先前的基础上,研究者们设计出了一种加入了这种构词规则,能将为本破译为正常希伯来语的算法。

“结果显示,超过80%的文本都能在一本希伯来语词典中找到,但我们还不知道这些单词拼在一起是否能说得通。”Kondrak说。

最后一步,研究者们依照上面的规则对手稿的第一句进行了破译。他们发现,在希伯来语中,破译所得结果并不能组成一个连贯的句子。

“然而,做过几次拼写上的修正后,谷歌翻译已经能够把它翻译成说得通的英文:

‘She made recommendations to the priest, man of the house and me and people.’”

研究者们在发表在《计算机语言协会学报》上的报告中如是写道。

Kondrak表示,对于“伏尼契手稿”的具体内容,他们其实依然不能理解。他认为,只有古希伯来方面的历史学家参与到研究中,他们才有对破译后的文本进行研究的机会。

与此同时,这支团队正计划将这种算法应用到其他古代文本的解读上。

论文地址:http://www.aclweb.org/anthology/Q16-1006

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2018-02-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

AAAI 2018 杰出论文出炉,两位中国留学生共同获奖

编辑 | 周翔 作为人工智能的顶级会议,AAAI 2018 将于 2.2~2.7 在美国路易斯安那州的新奥尔良举行。然而,大会还没开始,获奖信息就已经在网上传播...

378140
来自专栏新智元

【AI+机器学习半年志】2016上半年大事记(国际篇)

【新智元导读】夏至已至,2016过了一半,人工智能领域在2016上半年发生了什么大事?还记得AlphaGo吗?科技博客网站Turing Machine从硬件、技...

36680
来自专栏量化投资与机器学习

R语言构建追涨杀跌量化交易模型(附源代码)

作者 张丹(Conan) 来源 http://blog.fens.me Rquant前言最近有读者要求公众号推送几篇关于R语言量化投资的内容。今天推送第一篇。后...

575100
来自专栏机器人网

这个折纸技术教你制作微型机器人

  在西雅图的2015国际机器人与自动化学术研讨会(ICRA)上,美国麻省理工学院和德国慕尼黑工业大学研究人员发布的研究成果引发广泛关注。论文题目挺长,《不插电...

55740
来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/4/8

注意下面很多链接需要科学上网,无奈国情如此 1. clustering 5种算法解释 The 5 Clustering Algorithms Data Scie...

32140
来自专栏AI科技大本营的专栏

冠军奖30万!刘强东搞了个“猪脸识别”比赛,中美两地同时启动(附比赛详细日程及赛题说明)

编辑 | Katerina Donna 润色 | 鸽子 11月6日,由京东金融与红杉资本联合主办的首届“JDD-2017京东金融全球数据探索者大会”在751大罐...

40290
来自专栏JasonhavenDai

论文相关知识1.核心期刊2. A、B、C类3.相关概念4.阅读方法5.参考阅读

1.核心期刊 CCL,全国计算语言学学术会议 ACL,国际计算语言年会 NIPS,神经信息处理系统进展大会 SCI SCI即《科学引文索引》(Science ...

37050
来自专栏量化投资与机器学习

【精选】破解波动性突破实盘系统

1、波动性突破实盘系统介绍 1.1 系统设计思想 波动性突破, 本身带有一定程度自适应市场的特点, 为趋势跟踪系统中的上品, 我们再加入时间清仓、 顺势下轿的...

35370
来自专栏华章科技

春招快到了,送你一份数据分析常见面试题

找了半年工作,面试了几个data science的职位,总结了一些常见的问题,在这儿抛砖引玉。

6510
来自专栏机器人网

精彩机械动图:人类真是太聪明了

这一次酷炫动图将把目光转向人造机械的工作原理。 例行警告:图多杀猫,没有连上Wi-Fi的手机党请迅速关闭此页面! 伸出圆手 ? 原理:对于机器人而言,学会如何...

43770

扫码关注云+社区

领取腾讯云代金券