在阅读一篇论文时,我很难理解描述的算法:
给出一个黑白数字图像的笔迹样本,切出一个字符进行分析。因为这可以是任意大小,所以算法需要考虑到这一点(如果更容易的话,我们可以假设大小为2^nx2^m)。
现在,给出这个图像的描述状态,我们将其转换为512位特性(512位哈希)如下:
图像特征映射是用4x4网格标准化的。
我现在还在思考如何拍摄任意的图像,分割成16个部分,并使用3x3Sobel操作符为每个部分提供12位。(但如果你对其他部分有一些洞察力,可以随意评论:)
发布于 2009-11-03 11:56:01
我在为Srihari等人写的同一篇论文而挣扎。(2002)我的博士论文。我想说这篇文章并不是很具体,但是作者参考了一份技术报告(CEDAR-TR-01-1)来获得更多的细节。这份报告似乎无法在互联网上查阅,所以我的建议是通过电子邮件与作者联系,并要求提供这份报告。如果有些事情不清楚,你也可以要求澄清。
发布于 2014-07-18 12:45:50
我看到这个问题很老,但也许它可以帮助某人--你可以将sobel算子应用于图像的水平和垂直边缘检测。根据结果,您可以计算图像的每个点的图像方向向量。在您的例子中,您需要将这些向量映射到12个方向。然后,在您的例子中,您将图像划分为4x4个子图像(16个部分),并计算每个部分中每个方向的强度。这为您提供了12*16=192特性。如果需要的话,我可以给出更详细的解释。
https://stackoverflow.com/questions/1237236
复制相似问题