我正在尝试使用python中的Tika来解析PDF文件。我使用的是python 2.7和Mac。我不能让它工作。我已经安装了它,然后:
from tika import parser
raw = parser.from_file('...file')
我得到了这个错误(为了简明起见进行了编辑):
Retrieving http://search.maven.org/remotecontent ... to /var/folders/... [MainThread ] [INFO ] Retrieving http:// ... [MainThread ] [WARNI] Failed to see startup log message; retrying...
...
2019-04-08 14:53:05,910 [MainThread ] [ERROR] Tika startup log message not received after 3 tries.
2019-04-08 14:53:05,916 [MainThread ] [ERROR] Failed to receive startup confirmation from startServer.
我的问题和这里的非常相似,Use tika with python, runtimeerror: unable to start tika server。然而,最高的答案对我来说不起作用。我已经安装了Java 8,但它仍然不能工作。我该怎么办?
发布于 2019-07-31 15:16:52
我不确定你是否还有这个问题--或者其他任何来这里的人的问题。即使您安装了Java 8(来自Oracle左右),终端仍然可以看到OSX附带的旧java。
您需要告诉终端使用您刚刚安装的新Java。把这个放到你的.bash_profile里
导出库“/ Plug-Ins/JavaAppletPlugin.plugin/Contents/Home/”/JAVA_HOME=
否则,请检查系统首选项> Java > Java > View > Path
您可以查看Java的路径,将所有内容复制到Home/,然后将其粘贴到导出JAVA_HOME="“
重新启动终端,tike现在应该可以工作了
https://stackoverflow.com/questions/55580156
复制相似问题