我可能会被这个问题打倒..但还是会试一试..由于Google Site Search正在停业,我们对其免费版本不感兴趣--我们决定使用Amazon Cloud Search选项。然而,挑战是-它不是直接的。我们必须构建一个爬虫,并且有一些功能需要自定义构建。
我正在尝试查看网站使用ACS并正常工作的示例,但我找不到任何好的东西。是否有人尝试过使用Amazon Cloud search进行网站搜索。我们的网站大约有15000多个页面。
我们是基于.net的解决方案-所以我想写一个爬虫..每晚提取内容并将其发送到Amazon。这是正确的方式吗?
发布于 2017-11-22 16:34:09
ACS是基于Solr的。如果您的网站在您的控制之下,我认为第一步是提取出所有有用的内容并将其生成xml/json文件,然后使用AWS CLI将这些文档上传到ACS。ACS提供了REST API,让您可以获取查询结果。您需要在上传索引之前定义索引。
https://stackoverflow.com/questions/44054576
复制相似问题