首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >从LOGSTASH读取PDF内容

从LOGSTASH读取PDF内容
EN

Stack Overflow用户
提问于 2017-02-07 18:43:09
回答 1查看 614关注 0票数 0

LOGSTASH是否可以从某个位置读取PDF文件并提取其中的内容,然后将此内容发送到目的地(KAFKA)?

据我所知,LOGSTASH可以读取.TXT或.LOG或.CSV文件,但我不确定它是否能够读取PDF中的内容。

关于这一行的任何建议都将是有帮助的。

如果没有,kafka有这个能力吗?可以从APACHE KAFKA中读取PDF内容吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-02-08 12:19:29

Logstash没有PDF输入筛选器。最好的办法是找到一个程序,它可以为您提供PDF文件中的文本。有一个问题可能会有帮助:How to extract text from a PDF?

然后你可以设置一些东西来生成PDF的文本版本,然后使用logstash将它们索引到elasticsearch中。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42087731

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档