我们需要阅读iPad相机拍摄的销售收入照片中的一些文字。下面是一个类似于我们需要阅读的示例:

这个问题有几个制约因素:
到目前为止,我们已经尝试过这样做:
我们现在正在考虑使用卷积神经网络创建一个自定义解决方案。我的问题是,我们如何建立一个模型,利用这两个约束,创造一个更简单,但非常准确的解决方案?
这是我们到目前为止提出的一般管道。
我们不知道现在还能做些什么。任何建议、建议和帮助都会很棒。
PS。我意识到这是一个关于设计方法的问题,而不是一个具体的编程问题。如果这违反了规定,我很抱歉。
发布于 2017-10-15 17:27:10
我建议您考虑deeplearning4j.org解决方案。你可以在强大的机器上训练他们的网络,然后保存网络状态并在android上使用。这里解释了如何在java的帮助下在安卓应用程序上使用他们的网络。
https://stackoverflow.com/questions/42006965
复制相似问题