AI 能破解600年前的神秘字符吗?

伏尼契手稿共有240页,被发现于100多年前,一个名叫威尔弗雷德·伏尼契的波兰裔美国人书商,1912年在意大利买下了这本书。

2005年,这本手稿收入耶鲁大学的贝内克珍本与手稿图书馆,书中的字母和语言与现代语言完全搭不上边。

耶鲁大学的贝内克珍本与手稿图书馆

经过检测,这本手稿成于十五世纪初,估计在1404-1438年间。经历了600多年,手稿已经非常脆弱,有些内容缺失,文本内容是从左到右书写。手稿内配有很多插图,包括植物、天文、生物学、医药等,但是对揭露书中的内容并没有太大帮助。

这份手稿被发现以来,专业的、业余的译解密码员都试图研究破译出只字片语,但都只留下一连串失败。

第二次世界大战期间,也有破译者分析过,依旧无解。有关代码的各种理论多年来一直在被抛出,比如,它是使用半随机加密方案创建的;字谜游戏;删除元音的书写系统。

甚至有人认为这份手稿只不过是恶作剧,书中的符号排列全无意义可言。

显然,加拿大的研究人员不这么认为,利用人工智能,他们甚至在揭秘这份手稿上迈出了一大步。

Greg Kondrak, PhD

阿尔伯塔大学自然语言处理专家格雷格·康德拉克(Greg Kondrak)认为,这对于人工智能来说,似乎是一个完美挑战。在他的研究生布拉德利·豪尔(Bradley Hauer)的帮助下,他们离破解代码又进了一步。

两位计算机科学家发现,文本内容是以希伯来语写的,并且字母按照固定的模式排列。坦白说,研究人员还是不知道伏尼契手稿的含义,但现在已经为其他专家准备了参与调查的平台。

研究人员的第一步是确认加密文本的语言。为此,AI 研究了有380种不同语言版本的《世界人权宣言》,来寻找模式。

经此训练,AI 分析了伏尼契手稿的乱码,得出的结论是这些文本在很大程度上可以确认是用希伯来文编译的。

康德拉克和豪尔对这一结果很震惊,他们在研究该项目的最初推测这些文本是用阿拉伯语写的。

康德拉克在声明中说:“这真令人惊讶。第一步我们证实了希伯来语,下一步是我们如何破译它。”

对于第二步,研究人员采用了以前的研究人员提出的假设,即脚本是用alphagram创建的,就是说,每个单词按照字母表顺序重新排列组成一个新词(alphagram 的该形式会写成:aaaghlmpr)。

在这一前提下,研究人员设计了一种算法,利用这些字谜,还原了真正的希伯来语单词。

结果是,有80%以上的单词都能在希伯来语字典中找到。但是还不能确定这些单词是否能连成有意义的句子。

最后一步,研究人员摘取伏尼契手稿的第一行,交给另外一位计算机科学家,同时还是以希伯来语为母语的同事莫什·科佩尔(Moshe Koppel)。科佩尔说,这些内容并没有在希伯来语中形成连贯的句子。

但是,在纠正了拼写错误以后,谷歌翻译给了他们一个答案:She made recommendations to the priest, man of the house and me andpeople.

大意是:她向牧师、家人、人民提出建议。

目前他们认为一些字符是可以对应的,包括狭窄、农民、光、空气、火等名词,使二人认为手稿确实是中世纪的炼金笔记书。

就如其他破译者面临的质疑一样,康德拉克和豪尔的研究也受到怀疑,他们也承认,伏尼契手稿中的文本太杂,重复的字符太多,不像流畅的作文,这意味着可能最终只能破解手稿上的名词。

但至少,他们已经确定了这本手稿的语言来自希伯来语。

此外,团队正计划继续改进演算法,并希望可以应用于其他古代未解手稿。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180131A1G3GZ00?refer=cp_1026

扫码关注云+社区