首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

深度学习碰上古文献,西南大学提出基于CNN的古彝文识别方法

摘要:作为世界六大古文字之一的古彝文记录下几千年来人类发展历史。针对古彝文的识别能够将这些珍贵文献材料转换为电子文档,便于保存和传播。由于历史发展,区域限制等多方面原因,针对古彝文识别的研究鲜有成果。本文把当前新颖的深度学习技术,应用到古老的文字识别中去。在四层卷积神经网络(Convolutional Neural Network, CNN)的基础上扩展出 5 个模型,然后再利用 Alpha-Beta 散度作为惩罚项对 5 个模型的输出神经元重新进行自编码,接着用两个全连接层完成特征压缩,最后在 softmax 层对古彝文字符特征进行重新评分,得到其概率分布,选择对应的最高概率作为识别的字符。实验表明本文所提方法相对于传统 CNN 模型而言对古彝文手写体的识别具有较高的精度。

02

细数自然环境OCR应用,牵手机器人最具市场前景

从古至今,文字经历了数代变革,最终发展成为现在的简体字。近来以来,随着科技的发展,人类变得越来越“懒”,从抛弃纸笔投入电脑的怀抱,再到现在从键盘到语音的转移。虽然不管如何发展,文字依然是人们不可丢弃的东西,但是出于让生活更便利的目的,它也在随着科技而发生变化,比如担当着人工智能基础之一的文字识别技术(OCR)。 OCR是指光学设备(扫描仪、数码相机等)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,其本质就是利用光学设备去捕获图像并识别文字,将人眼的能力延

03
领券