我已经多次尝试创建一个从汉字中提取笔画信息的算法。我尝试过各种方法,但没有一种方法非常令人满意,可能是因为我对图形算法的了解有限。
基本上,我有以下数据:

从这里,我试着提取中风。如果您必须这样做,考虑到可用的数据,您将使用什么方法?你能想到任何自动提取笔画的方法吗?
发布于 2011-08-09 07:56:27
我首先计算每个蓝色像素到最近的白色像素的距离。然后,您可以保持所有的红色像素是更接近最近的白色像素。这种效果可能会通过一些过滤器(可能类似于冲蚀,然后是关)来平滑。
发布于 2011-08-09 08:27:14
您可能正在寻找中轴,也称为拓扑骨架。简而言之,你将解决所有的点,是等距的多个点在边缘。您可能需要对结果曲线进行一些平滑或简化。
棘手的部分是分离形状的部分,这是常见的不止一笔。我不相信有什么明确的方法可以做到。也许将“公共区域”定义为以每个骨架交点为中心的圆,与最近的边缘相切?那么,也许可以在缺口之间插入一些笔画宽度?
发布于 2011-08-09 08:06:57
我不认为你能想出一种没有错误情况的算法。有些字符的某些部分是相同的,但并不等同于相同的笔画计数。例如,馬技术上也从视觉的角度包括口(当然不是语言方面的)。
我唯一的想法是把这个区域分成几个小区域,然后写一个算法,试图按照设定的笔画顺序来画,但我不能想象这会很容易,根据字体的不同,一些线会延伸到不应该在的区域。
还有一些字符由于其不寻常的布局而无法很好地处理算法--只有遵循严格的笔画顺序规则,才能得到正确的数字:示例包括凹和凸。
我不得不问--笔画计数是每个字符的基本信息--为什么你需要创建一个算法来计算它呢?在自定义字典中查找字符的笔画计数,难道不更容易进行字符识别吗?
https://stackoverflow.com/questions/6992952
复制相似问题