在https://cloud.google.com/document-ai/docs/process-forms中,我可以看到一些处理单个文件的示例。但在大多数情况下,公司都有大量的文档。在这种情况下,如何扩展文档的人工智能处理?您是否将文档ai与Spark结合使用?还是有别的办法?
发布于 2020-07-30 11:24:45
我只能找到以下内容:batch_process_documents
处理许多文档,并返回一个异步响应,该响应将保存在云存储中。
从那里,我认为我们可以通过添加bucket前缀的输入路径来参数化提升我们的作业,并将作业分配到几台机器上。
例如,所有这些都可以通过气流进行编排。
https://stackoverflow.com/questions/63171762
复制相似问题