首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Tika app、Tika Server和Java Wrapper有什么区别?使用的是哪一种?何时使用?

Tika app、Tika Server和Java Wrapper有什么区别?使用的是哪一种?何时使用?
EN

Stack Overflow用户
提问于 2018-03-02 06:20:05
回答 1查看 237关注 0票数 1

我想使用Apache Tika来处理企业级的大量文档。我使用哪一个,Tika服务器、Tika应用程序还是Java调用?你能给我推荐一种系统架构吗?(即负载均衡3-4 Tika物理上不同的服务器)

EN

回答 1

Stack Overflow用户

发布于 2021-10-11 22:58:09

对REST端点进行PUT调用以通过HTTP发送数千个0.5 GB的文档,一次一个,对于Tika服务器来说不是一个合适的场景。这将不是内存效率和服务器will likely crash与某种内存泄漏或错误。

尽管从v1.19开始,现在有了一个-spawnChild选项,可以在进程处理完-maxFiles之后对其进行periodically restart。从v2.x开始,这里是now the default

根据您的需要,只需使用batch mode中的tika-app即可:

  • 在本地运行,使用您指定的输入和输出目录
  • 设置父/子进程以可靠地处理多个解析器线程并行
  • 可以每隔x分钟或在y个文件之后重新启动子进程以避免内存泄漏
  • Logs failures

代码语言:javascript
运行
复制
java -jar tika-app.jar -i <input_directory> -o <output_dir>
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49059599

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档