AI 能破解600年前的神秘字符吗？

文章来源：企鹅号 - WTT资讯

伏尼契手稿共有240页，被发现于100多年前，一个名叫威尔弗雷德·伏尼契的波兰裔美国人书商，1912年在意大利买下了这本书。

2005年，这本手稿收入耶鲁大学的贝内克珍本与手稿图书馆，书中的字母和语言与现代语言完全搭不上边。

耶鲁大学的贝内克珍本与手稿图书馆

经过检测，这本手稿成于十五世纪初，估计在1404-1438年间。经历了600多年，手稿已经非常脆弱，有些内容缺失，文本内容是从左到右书写。手稿内配有很多插图，包括植物、天文、生物学、医药等，但是对揭露书中的内容并没有太大帮助。

这份手稿被发现以来，专业的、业余的译解密码员都试图研究破译出只字片语，但都只留下一连串失败。

第二次世界大战期间，也有破译者分析过，依旧无解。有关代码的各种理论多年来一直在被抛出，比如，它是使用半随机加密方案创建的；字谜游戏；删除元音的书写系统。

甚至有人认为这份手稿只不过是恶作剧，书中的符号排列全无意义可言。

显然，加拿大的研究人员不这么认为，利用人工智能，他们甚至在揭秘这份手稿上迈出了一大步。

Greg Kondrak, PhD

阿尔伯塔大学自然语言处理专家格雷格·康德拉克(Greg Kondrak)认为，这对于人工智能来说，似乎是一个完美挑战。在他的研究生布拉德利·豪尔（Bradley Hauer）的帮助下，他们离破解代码又进了一步。

两位计算机科学家发现，文本内容是以希伯来语写的，并且字母按照固定的模式排列。坦白说，研究人员还是不知道伏尼契手稿的含义，但现在已经为其他专家准备了参与调查的平台。

研究人员的第一步是确认加密文本的语言。为此，AI 研究了有380种不同语言版本的《世界人权宣言》，来寻找模式。

经此训练，AI 分析了伏尼契手稿的乱码，得出的结论是这些文本在很大程度上可以确认是用希伯来文编译的。

康德拉克和豪尔对这一结果很震惊，他们在研究该项目的最初推测这些文本是用阿拉伯语写的。

康德拉克在声明中说：“这真令人惊讶。第一步我们证实了希伯来语，下一步是我们如何破译它。”

对于第二步，研究人员采用了以前的研究人员提出的假设，即脚本是用alphagram创建的，就是说，每个单词按照字母表顺序重新排列组成一个新词（alphagram 的该形式会写成：aaaghlmpr）。

在这一前提下，研究人员设计了一种算法，利用这些字谜，还原了真正的希伯来语单词。

结果是，有80％以上的单词都能在希伯来语字典中找到。但是还不能确定这些单词是否能连成有意义的句子。

最后一步，研究人员摘取伏尼契手稿的第一行，交给另外一位计算机科学家，同时还是以希伯来语为母语的同事莫什·科佩尔(Moshe Koppel)。科佩尔说，这些内容并没有在希伯来语中形成连贯的句子。

但是，在纠正了拼写错误以后，谷歌翻译给了他们一个答案：She made recommendations to the priest, man of the house and me andpeople.

大意是：她向牧师、家人、人民提出建议。

目前他们认为一些字符是可以对应的，包括狭窄、农民、光、空气、火等名词，使二人认为手稿确实是中世纪的炼金笔记书。

就如其他破译者面临的质疑一样，康德拉克和豪尔的研究也受到怀疑，他们也承认，伏尼契手稿中的文本太杂，重复的字符太多，不像流畅的作文，这意味着可能最终只能破解手稿上的名词。

但至少，他们已经确定了这本手稿的语言来自希伯来语。

此外，团队正计划继续改进演算法，并希望可以应用于其他古代未解手稿。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货