首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >绘图符号识别:如何实现识别

绘图符号识别:如何实现识别
EN

Stack Overflow用户
提问于 2014-05-01 23:05:11
回答 2查看 215关注 0票数 0

我尝试实现对鼠标绘制的汉字的识别。对于我想要识别的每个汉字,我都有一个样本文件,它提供了所有笔画的开始和结束位置,以及各自笔画的开始和结束位置(对于固定的图像分辨率)。

我想知道如何使用这些笔画信息来识别汉字。我在考虑使用笔画开始和结束之间的斜率,并将其用作机器学习的特征,但如果每个汉字只有一个样本,我将有大约2000个类(每个汉字一个)和数据稀疏问题(每个汉字只有一组笔画信息)。在这样的稀疏数据集上使用ML是可能的吗?

EN

回答 2

Stack Overflow用户

发布于 2014-05-01 23:53:22

你的模型可能会受到数据集稀疏性的影响,但仍然有可能对其应用某些机器学习算法,特别是参数数量较少的较简单算法。(简而言之,试试看)。

然而,你所描述的情况在我看来并不像乍一看那么糟糕。根据一组有序的识别笔画(我猜)来确定哪个汉字是相当简单的。困难在于从一开始就识别笔画。

因此,真正需要数据的机器学习任务是笔画识别。然而,这个模型每个类都有远远不止一个样本,因为每个笔画可能会出现在多个汉字中。

票数 0
EN

Stack Overflow用户

发布于 2014-05-02 13:11:56

首先,您可能会从http://demos.shogun-toolbox.org/application/ocr/中获得一些灵感(其源代码位于幕府发行版中)。

然后将每个班级的单个汉字作为训练示例:当汉字非常相似时,这将不会很好地工作。然而,你可以做的是生成虚拟例子,你可以通过稍微扭曲你的汉字来生成虚拟例子,例如,平移,旋转,缩放等。这就是Yann和其他许多人在MNIST (http://yann.lecun.com/exdb/mnist/)上所做的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23410426

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档