我想训练一个CNN,它可以实时地对大分辨率图像进行推理。CNN必须阅读由5位数字组成的手写数字。LeNet-5给了我一个很好的精度,但是通过一种简单的滑动窗口方法,我在FullHD图像上得到了4000个窗口(虽然有很大的进步),这还不够快。(CPU上的一个窗口为10 on >40 per每幅图像)
所以我研究了一些更有效的滑动窗口的方法,并遇到了Overfeat。它将整个图像转换为类维输出数组windowsX、windowsY和类.这里的好处是,不需要多次计算重叠区域。现在,我正试图在slim的帮助下训练
我已经用tensorflow训练了一个用于ocr的crnn模型。然后我在Windows64位机器上用tensorflow c++ API部署它,它工作得很好。现在我想将该模型部署到windows 32位机器上,但我注意到大多数深度学习框架,如tensorflow和pytorch,都不支持32位机器。然后我尝试了opencv dnn模块和ncnn框架,但它们都不支持我的模型中使用的挤压和解压操作。现在我不知道,有没有人能给我一些建议?谢谢。
It fails with the following output:
Change Dir: /cygdrive/c/users/user/PycharmProjects/crnn-masterexe -o CMakeFiles/cmTC_71c00.dir/testCXXCompiler.cxx.o -c /cygdrive/c/users/user/PycharmProjects/crnn-mas
我的目标是对图像(从视频中提取)进行预处理,以便进行OCR检测。文本始终为黑色,如下例所示: ? 我试着使用年龄帧和HVS面具: cv2.accumulateWeighted(frame,avg2,0.005) # Convert BGR to HSV # define range of black color in HSV upp