我用TYPO3 indexed_search做过几个网站。然而,我觉得我仍然不理解indexed_search和crawler之间关系的本质。例如,根据一些作者的说法,要索引tt_news,我只需要一个通用的爬虫配置和一个用于tt_news的indexed_search配置;但是对于其他教程的作者,我应该为tt_news创建一个爬虫配置。
我不清楚crawler和indexed_search之间有什么关系。它们是如何匹配的?根爬虫配置在找到indexed_search配置时就运行它,难道还不够吗?或者,URL是否需要同时由两者生成?我已经设法使用一个爬虫根配置创建了一个索引,但是我通过我自己的调用cli_dispatch.phpsh的shell脚本来运行索引。
indexed_search和crawler在功能(URL生成)方面是冗余的吗?
欢迎提供任何线索。
最好的
B.
发布于 2017-04-26 14:01:15
Indexed_search可以在没有爬虫的情况下通过索引访问者访问的页面来工作。明显的缺点是,没有被访问的页面不会被索引,因此不会显示在搜索结果中。如果您配置了多个前端用户组,则访问页面的机会会更低。
爬虫可以通过访问每个页面来解决这个问题。此外,它可以访问页面,就像它是FE用户组(组合)的成员一样。这样,它可以帮助为所有类型的用户建立整个网站的索引。
大部分细节在Xavier Perseguers的tutorial中进行了解释。它是为旧版本编写的,但我猜其中大部分仍然有效。
https://stackoverflow.com/questions/43622153
复制相似问题