文章/答案/技术大牛

发布

社区首页 >问答首页 >TYPO3:索引搜索和爬虫关系

问TYPO3:索引搜索和爬虫关系
EN

Stack Overflow用户

提问于 2017-04-26 06:41:54

回答 1查看 160关注 0票数 1

我用TYPO3 indexed_search做过几个网站。然而，我觉得我仍然不理解indexed_search和crawler之间关系的本质。例如，根据一些作者的说法，要索引tt_news，我只需要一个通用的爬虫配置和一个用于tt_news的indexed_search配置；但是对于其他教程的作者，我应该为tt_news创建一个爬虫配置。

我不清楚crawler和indexed_search之间有什么关系。它们是如何匹配的？根爬虫配置在找到indexed_search配置时就运行它，难道还不够吗？或者，URL是否需要同时由两者生成？我已经设法使用一个爬虫根配置创建了一个索引，但是我通过我自己的调用cli_dispatch.phpsh的shell脚本来运行索引。

indexed_search和crawler在功能(URL生成)方面是冗余的吗？

欢迎提供任何线索。

最好的

content-management-system

web-crawler

typo3

回答 1

Stack Overflow用户

发布于 2017-04-26 14:01:15

Indexed_search可以在没有爬虫的情况下通过索引访问者访问的页面来工作。明显的缺点是，没有被访问的页面不会被索引，因此不会显示在搜索结果中。如果您配置了多个前端用户组，则访问页面的机会会更低。

爬虫可以通过访问每个页面来解决这个问题。此外，它可以访问页面，就像它是FE用户组(组合)的成员一样。这样，它可以帮助为所有类型的用户建立整个网站的索引。

大部分细节在Xavier Perseguers的tutorial中进行了解释。它是为旧版本编写的，但我猜其中大部分仍然有效。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/43622153

复制

相似问题

问TYPO3:索引搜索和爬虫关系
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问TYPO3:索引搜索和爬虫关系EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问TYPO3:索引搜索和爬虫关系
EN