It fails with the following output:
Change Dir: /cygdrive/c/users/user/PycharmProjects/crnn-masterexe -o CMakeFiles/cmTC_71c00.dir/testCXXCompiler.cxx.o -c /cygdrive/c/users/user/PycharmProjects/crnn-mas
我想训练一个CNN,它可以实时地对大分辨率图像进行推理。CNN必须阅读由5位数字组成的手写数字。LeNet-5给了我一个很好的精度,但是通过一种简单的滑动窗口方法,我在FullHD图像上得到了4000个窗口(虽然有很大的进步),这还不够快。(CPU上的一个窗口为10 on >40 per每幅图像)
所以我研究了一些更有效的滑动窗口的方法,并遇到了Overfeat。它将整个图像转换为类维输出数组windowsX、windowsY和类.这里的好处是,不需要多次计算重叠区域。现在,我正试图在slim的帮助下训练
我对ML世界很陌生,一直在阅读有关ML和TensorFlow的内容。我的目标是在Android手机上实时阅读以下示例:所以我尝试了firebase ML OCR,它工作得很好,它读取完整的值,但是它不读取小数点,也读取了很多周围的文本。因此,我的想法是,我应该首先检测黑色和红色的边框,然后检测内部的单个数字。另外,如何使用两种模型,一种是提取图像的一部分(黑色和红色边界区域),然后将它们传递给OCR模型?
最后一个数字如何?它总是在两个数字之间(例如:1和2)?