首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

金鸣表格识别中何时应勾选“手写”选项?

在金鸣表格文字识别系统的表格识别模块中,有个“手写”的复选框可供用户选择性使用。这里的“手写”是手写识别的简称,设置此项的目的是为了让用户更准确地识别手写的表格图片中的文字。为何要单独设置这个选项而不是由程序全自动地进行处理呢?主要的原因是因为手写文字识别与印刷文字识别的算法有差非常大的区别,它们是二种不同的算法。其主要区别如下:

1. 数据集差异:手写文字识别依赖于手写文字的数据集,包含各种不同人的手写样本;印刷文字识别则依赖于印刷文字的数据集,这些数据集通常是从印刷物、书籍或文档中获取的。

2. 特征提取:手写文字识别需要提取手写字母和数字的特征,如笔画的形状、方向等;而印刷文字识别则依赖于印刷字体的特征,如笔画的粗细、形状、曲线等。

3. 模型训练:手写文字由于字体形状差异较大,通常不会很工整,识别算法除了使用光学识别原理外,还主要依赖深度学习技术,如卷积神经网络(CNN)等进行训练;而印刷文字由于字体工整,识别算法可以使用传统的机器学习算法,如支持向量机(SVM)等。

4. 难度:手写文字识别比印刷文字识别更具挑战性,因为手写文字通常存在很大的变异性,不同人的书写风格差异较大,而印刷文字则非常规范和统一,识别难度较低。

由此可见,手写文字识别和印刷文字识别在数据集、特征提取、模型训练和难度等方面都存在较大的差异,需要使用不同的算法和技术来进行识别,所以金鸣识别系统会将手写识别独立出来,让用户根据图片中的文字是否手写来进行自由选择。

在金鸣识别的表格识别模块中,如果您的待识别图片主要文字为手写的,我们建议用户勾选“手写”,这样,程序会调用手写识别算法,从而获得更准确的文字识别结果,而如果图片中没有手写文字或只有极为个别的文字为手写的,则不建议勾选“手写”,因为我们上面说了,手写识别和印刷体文字识别是完全不同的算法,如果我们将手写识别算法强行用于印刷体的文字识别,反而会影响其识别的准确率和效果。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OPfvEEdj4sM_olxke-PgsilQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券