我试图向Tika服务器发送PDF以进行内容提取,但始终会收到错误:“无法使用源编码从流中转换文本”
Tika是这样期待这些文件的:
所有接收文件的服务都使用HTTP "PUT“请求。当使用"PUT”时,必须在请求正文中发送原始文件,而不需要任何额外的编码(不要使用多部分/表单-数据或其他容器)。源https://wiki.apache.org/tika/TikaJAXRS#Services
使用XMLHttpRequest()对文件进行感测的正确方法是什么?
代码:
var response, error, file, blob, xhr;
file = new File("/PROJECT/web/dateien/ai/pdf.pdf");
blob = file.toBuffer().toBlob("application/pdf");
url = "http://localhost:9998/tika";
// send data
try {
xhr = new XMLHttpRequest();
xhr.open("PUT", url);
xhr.setRequestHeader("Accept", "text/plain");
xhr.send(blob);
} catch (e) {
error = e;
}
({
response: xhr.responseText,
status: xhr.statusText,
error: error,
type: xhr.responseType,
blob: blob
});
错误:
发布于 2016-07-11 07:04:02
我怀疑当XHR体内有blob时,wakanda会将请求转换为POST请求。你能在你的XHR请求中添加详细信息吗?如果是这样,您可能可以在wakanda (https://github.com/Wakanda/wakanda-issues/issues)中填写一个问题。
希望能帮上忙,亚恩
https://stackoverflow.com/questions/38300746
复制相似问题