我们在EMC Documentum中提供了大量pdf文档我们有一个要求,我们必须将Apache Solr与Documentum集成,以便我们可以在solr中搜索特定文档,并从Documentum获取文档
我查看了下面的链接,它不是足够的信息https://community.emc.com/docs/DOC-6520
帮助是非常有价值的
发布于 2016-05-20 13:25:20
您所发布的链接将为您提供一个有效的解决方案。该作者建议编写一个连接到Documentum存储库的自定义爬虫,然后使用Apache Tika执行Solr的内容提取。
不过,我建议您使用
充当将内容从Documentum获取到
发布于 2017-10-18 19:07:12
我已经构建了自己的连接器,可以从Documentum中提取数据并插入到Elasticsearch或solr中,我愿意与您分享。请联系我
https://stackoverflow.com/questions/37323398
复制相似问题