我是ElasticSearch的新手。我已经完成了关于创建索引的非常基本的教程。我确实理解索引的概念。我希望ElasticSearch在.PDF文件中搜索。根据我对创建索引的理解,我似乎需要读取.PDF文件并提取所有用于索引的关键字。但是,我不明白我需要采取什么步骤。如何读取.PFD文件来提取关键字。
发布于 2016-01-19 10:13:50
发布于 2016-11-15 16:22:50
看起来elasticsearch-mapper-附件插件在5.0.0 (2016年10月26日发布)中被废弃了。文档建议使用吞食附件处理器插件作为替代。
安装:
sudo bin/elasticsearch-plugin install ingest-attachment
有关如何使用Ingest附件插件的信息,请参见如何用吞食附件插件在Elasticsearch 5.0.0中索引pdf文件?。
发布于 2016-01-19 11:18:21
安装Elasticsearch mapper-附件插件并使用类似于以下代码的代码:
public String indexDocument(String filePath, DataDTO dto) {
IndexResponse response = null;
try {
response = this.prepareIndexRequest("collectionName").setId(dto.getId())
.setSource(jsonBuilder().startObject()
.field("file", Base64.encodeFromFile(filePath))
.endObject()).setRefresh(true).execute().actionGet();
} catch (ElasticsearchException e) {
//
} catch (IOException e) {
//
}
return response.getId();
}
https://stackoverflow.com/questions/34857179
复制相似问题