我正在探索Google Vision API for OCR。我们有很多表格是由计算机生成并由用户填写的。比如医疗报告和挂号表。我们需要处理这些图像,并从中提取字符。我已经尝试过Google Vision API,它在计算机生成表单的情况下工作得很好,但是手工填写的表单会产生问题。就像在y轴稍高一点的地方用数据填充表单一样,单词被认为是上一行/下一行。如下所示是输出
Study Contact Name:
Test
期望的
Study Contact Name: Test
代码参考:
有没有一种方法可以把它放在一行中,或者理解它是否是该行的一部分?
是否有其他API可以在此场景中提供帮助?
我需要从数据集中的文本列中提取产品名称。目前,我使用正则表达式从文本中间提取产品名称,但有时产品名称拼写错误、不完整甚至修改过,这意味着我无法识别和提取产品名称。
我们目前有大约1500-2000产品在这份清单上,我有一个数据集,这些产品已经确定了大约30,000行。是否有一种方法,我可以使用这些历史数据来改进对尚未被识别的产品的识别?
举个例子:
The product X produced by the Company Y is used to treat skin diseases
注意:产品名称不出现在固定位置。
我很难理解应该如何在微服务之间进行基本的通信,而在其他问题中,我还没有找到一个很好的解决方案或标准的方法来实现这一点。让我们使用这个基本的例子。
我有一个发票服务,返回发票,每个发票将包含有关用户和产品的信息(I)。如果我有一个视图需要呈现特定用户的发票,我只需提出一个简单的请求。
let url = "http://my-domain.com/api/v2/invoices"
let params = {userId:1}
request(url,params,(e,r)=>{
const results = r // An array of 1000 i