我正在尝试用ApacheSolrv6.0.1索引一个网站。Solr通常索引正确,但跳过301重定向并发出警告。post -c getting-started https://example.com -recursive 5 -delay 1Entering crawl at level 1 (118 links total, 117 new)
SimplePostTool: WARNING: The URL https://example.com/help/guides returned a HTTP result status of 301
我是nutch新手。我正在使用nutch 1.7,抓取已经完成。我的问题是如何检索抓取数据?在Nutch1.1中,有一个名为org.apache.nutch.searcher的包提供了这一功能。但是如果我在Java应用程序中导入nutch1.1.jar并尝试运行旧代码它给出了这个错误:
java.lang.VerifyError: class org.apache.nutch.indexer.NutchSimilarity(LuceneSearchBean.jav