腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Apache
tika
的
替代
方案
我试着使用
Apache
Tika
,花了3天多
的
时间在Android上工作,但都无济于事。有没有什么库可以用来从上面提到
的
文件中提取元数据。
浏览 30
提问于2017-02-22
得票数 0
回答已采纳
3
回答
使用
Apache
Commons守护程序配置
Tika
Windows服务
、
、
我正在尝试使用
Apache
Commons Daemon将
Tika
JAXRS作为Windows服务运行。我已经从获得了
tika
-server-1.7.jar我可以让
Tika
作为服务启动,但我不能确定使用什么作为-1.7.jar" --StartClass "org.
apache
.
tika
.server.TikaServerCli&q
浏览 4
提问于2015-03-04
得票数 1
1
回答
Apache
如何提取带有out页眉和页脚内容
的
html正文
、
、
、
org.xml.sax.SAXException:未声明命名空间 import org.
apache
.
tika
.exception.TikaException;import org.
apache
.
tika
.io.TikaInputStream;import org.
apache
.
tika<
浏览 3
提问于2017-03-03
得票数 4
1
回答
适用于ios
的
Apache
Tika
替代
方案
、
我知道
Apache
Tika
是一个文本提取器。它可以从doc,pdf,ppt和许多其他文件格式中提取文本。现在我在ios中需要这个功能,所以我想知道有没有
替代
ios
的
Apache
Tika
的
方法?如果ios没有这样
的
库,你可以告诉我可以解压指定文件格式
的
工具。 提前谢谢你。
浏览 0
提问于2012-09-05
得票数 0
回答已采纳
2
回答
Tika
1.4 -不能让它提取元数据或内容
为了从各种文件中提取内容和元数据,我在我
的
NetBeans IDE ( Mac上为7.4)中本地创建了一个小
的
java测试项目。
浏览 0
提问于2014-01-21
得票数 1
回答已采纳
5
回答
实现搜索文档(PDF、XML、HTML、MS Word)
的
最佳方法是什么?
、
、
、
在java web应用程序中编写用于搜索文档
的
搜索功能
的
好方法是什么? “带标签
的
搜索”适合这样
的
搜索功能吗?
浏览 0
提问于2009-05-06
得票数 1
回答已采纳
2
回答
如何在Android上使用
Apache
Tika
、
我试图使用
Apache
来解析一些文档,但是它给了我太多
的
错误和警告。dependencies { exclude group: 'org.json', module: 'json'exclude group: 'commons-logging', module: 'c
浏览 3
提问于2017-02-19
得票数 4
回答已采纳
2
回答
Java : Microsoft word文档到html
的
转换器样式表
、
、
根据需要,我正在尝试转换文件或文件(微软
的
word)与
Apache
tika
的
html格式 import javax.xml.transform.sax.TransformerHandler; import org.<em
浏览 2
提问于2013-04-16
得票数 2
回答已采纳
1
回答
SpringBoot中
的
Tika
解析器配置
、
、
我在我
的
项目中使用了一个
tika
解析器。我正在使用这个包中
的
三个类:org.
apache
.
tika
.parser.txt.CharsetDetector;WARN org.
apache
.
tika
.parser.SQLite3P
浏览 2
提问于2019-12-30
得票数 0
回答已采纳
1
回答
Apache
Tika
无法解析HDFS文件
、
、
、
我正在使用
Tika
库来解析存储在Hadoop集群中
的
文档。我使用
的
代码如下:import urllib3在linux上,如果我给出一个本地路径,
tika
可以解析,但是对于hdfs路径,我得到一个 Spark I/
浏览 0
提问于2018-03-13
得票数 1
1
回答
用
Tika
编译应用程序
的
Java 13问题加载模块
、
、
、
我正在尝试将使用
Tika
的
Java应用程序从OracleJDK 1.8迁移到OPenJDK 13。检查Eclipse中
的
项目库,我可以看到
tika
-core和
tika
-解析器(v1.24)都是模块化
的
:$ jar --file=
ti
浏览 4
提问于2020-06-05
得票数 0
4
回答
如何使用
Apache
1.5解析大型文本文件?
、
、
问题:对于我
的
测试,我想从一个335 MB
的
文本文件中提取文本数据,这个文本文件是维基百科使用
Apache
的
“分页器-20140701-060000.txt”。我
的
解决
方案
:我尝试使用TikaInputStream,因为它提供了缓冲,然后我尝试使用BufferedInputStream,但这并没有解决我
的
问题。java.io.IOException; import org.
apache
.
浏览 7
提问于2014-07-03
得票数 4
回答已采纳
1
回答
Apache
提取扫描PDF文件
、
、
、
、
我在使用
Apache
(版本1.10)时遇到了一些问题。我有一些PDF文件,只是扫描了一张纸。这意味着每一页只是一张图片。我
的
目标是提取PDF文件
的
文本无论如何。我
的
tesseract设置正确,提取JPG和PNG文件就像一种魅力。我使用
的
代码看起来是这样
的
(不要介意缺少
的
扩展处理): AutoDetectParser parser我已经尝试过PDFParserConf
浏览 1
提问于2015-09-02
得票数 9
2
回答
是什么导致java.lang.NoClassDefFoundError随机发生?
、
、
我们一直在我们
的
服务器中随机获取NoClassDefFoundError。它偶尔会抛出这个错误,而且大多数情况下它不会抛出任何问题。这种奇怪行为
的
原因是什么?以下是例外情况。依赖项
的
同一个jar中。在静态块中寻找一些可能
的
运行时异常。但它本身没有静态块。是什么使它能够随机抛出异常并在没有任何问题
的
情况下运行呢?我们用蚂蚁来建造。下面是ant.properties中控制
tika
依赖项
的
部分。Junrar是
tika
的
一部分。=
浏览 4
提问于2020-07-22
得票数 1
1
回答
检查Java中
的
mime类型
、
、
我在检查我
的
Resource
的
mime类型时遇到了问题,我这样做: String mimeType = URLConnection.guessContentTypeFromStream(is); 当我
的
fileResource是jpeg/jpg文件,然后我<
浏览 0
提问于2021-05-07
得票数 0
1
回答
Apache
Tika
应用程序配置文件
、
我在我
的
Ubuntu 16.04服务器上使用
Apache
Tika
App作为一个命令行工具来提取文档内容。
Apache
Tika
网站提供了以下内容:
Tika
构建由许多组件组成,并生成以下主要二进制文件:<em
浏览 144
提问于2018-07-28
得票数 4
1
回答
向grails项目中添加
apache
-
tika
依赖项
的
正确方法是什么?
、
at java.lang.ClassLoader.loadClass(ClassLoader.java:357)compile ("org.
apache
.
tika
:
tika
-core:1.4")如果我不将
tik
浏览 2
提问于2013-08-07
得票数 0
4
回答
如何在lucene中索引pdf,ppt,xl文件(基于java或者python或者php都可以)?
、
、
我还想知道如何在索引时添加元数据,以便提高一些参数
浏览 1
提问于2010-04-06
得票数 4
回答已采纳
1
回答
在尝试解析具有文本包含图像
的
pdf时使用
Apache
tika
解析器
的
问题
、
、
、
、
对于下面的用例- pdf文件和图像中
的
文本,pdf分析器运行时异常
的
解析失败。全错误堆栈跟踪:- org.
apache
.
tika
.parser.CompositeParser.parse(CompositeParser.java:312) ~org.
apache
.
tika
.
tika
-core-2.6.0.jar:2.6.0 at org.
apache
.
tika
.parse
浏览 19
提问于2022-11-11
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券