Yandex 训练其神经网络来破译具有复杂的革命前拼写的档案记录。同时,您已经可以在Search by Archives服务中试用该技术。现在它包含超过 250 万页的历史文件。
光学字符识别系统作为算法的基础。它考虑到手写的特殊性,识别失去相关性的字母,并能够理解档案文件的结构。
Yandex 认为,Search in Archives 服务将有助于提高历史学家、社会学家、人口统计学家、系谱学家的工作效率,并将帮助那些正在寻找其家庭信息的人。随着时间的推移,存储和可用扫描文件的数量将会增加。
领取专属 10元无门槛券
私享最新 技术干货