本文由 猫眼科技(ID:MaoyanTC)整理编译
消息源:
https://gizmodo.com/artificial-intelligence-may-have-cracked-freaky-600-yea-1822519232
文章基于创作共用协议发布,转载请留言
· 人· 工· 智· 能·
最近,人工智能领域又有了重大的突破!
长达230多页,保存了600多年的伏尼契手稿即将被它破解。
先来说说这份写满文字与插图,却又让人看不懂,还跟任何语言都不沾边,让20世纪无数专家学者感到头疼的神秘手稿到底是何方神圣?
1912 年,美国珍本书商威尔弗雷德·伏尼契(Wilfrid Voynich)在罗马附近一所耶稣会大学图书馆的地下室,发现了一份奇特字体写成的手稿,手稿中有许多植物、天文符号和出浴美女等奇异的图片。
它有点像中世纪炼金术士或草药医生的参考书,从插图中的发型等特征看来,这本书的制作时间应该介于1470~1500年间,距今足有600多年。
它在1586年由神圣罗马帝国的鲁道夫二世收购,1600年代,也曾有数十位学者尝试解读过它,后来它神秘消失了250年,直到19世纪伏尼契发现并将它命名。
对它的破译工作从来没有停止过,有学者说它是半随机加密方式创建的字谜,或是被删除元音字母的代码,还有人说它是精心制作的骗局。
但如果是骗局,怎么没有人能看懂,作者意图又是什么呢?
所以最后那点其实说不通。
最近,阿尔伯塔大学自然语言处理专家格雷格·康德拉克(Greg Kondrak)在他的学生布拉德利·豪尔(Bradley Hauer)的帮助下,利用AI对伏尼契手稿进行翻译探索。
第一步是要找出加密文本的语言,为此AI研究了"世界人权宣言"的380种不同语言编写形式,然后开始分析伏尼契手稿中的乱码。
结论是伏尼契文本是用希伯来语的形式编写,并且都是以固定模式排列组合,而在此之前,大部分人都以为手稿是由阿拉伯语编写的。
确定了代码语言,难度就降低了一大半,再找到确切的加密方式就够了。
他们采用了之前研究人员提出的假设——字母表顺序加密,就是说先写好文本,然后将文本中的每个字母都按照字母表顺序重新排序书写出来。
就比如说,you are pretty(你真美),转换为密码格式就是ouy aer eprtty。
是不是很简单,拿去撩小哥哥小姐姐吧。
接着,康德拉克和学生豪尔就设计了一个编译算法,希望把手稿按照他们的假设翻译成真正的希伯来文字。
最后,他们找来了同事计算机科学家兼本地希伯来语演讲者莫斯赫·科佩尔(Moshe Koppel)。
但当科佩尔拿到这些破译的文字的时候,他也很难靠自己的能力把它们变成一个连贯的句子读出来。
于是,他们又进行了进一步的拼写修正,然后用谷歌翻译将其转换为通顺的英文,比如翻译过来的有句完整的话是,"她向神父,家里的人以及我提出了建议"。
目前,他们还没完成全部的240页的手稿翻译,因为有很多1500年代的语言方式还搞不明白,还需要一个懂希伯来语的历史学家帮忙破译。
但至少在AI的帮助下,科学家确定了它的起源语言以及它的编码方式,还是很叼的。
他们计划利用人工智能,继续破解其它那些悬而未决的古老代码,为人类做更多的贡献,给他们鼓个掌。
- BUT -
我其实更想知道我那蛙儿子半夜10点不回家去了哪里。
“猫眼科技”(公号ID:MaoyanTC)
探索10-20年后的科技生活
脑机结合、人类增强、地外世界、AI&MR、电子人、硬科学、新硬件...这里涵盖所有正在我们身边发生的科技变革。
Hum...还有蓝色星球上的一些科技八卦,神人趣事..
领取专属 10元无门槛券
私享最新 技术干货