我的团队一直在使用Sharepoint 2010抓取大量外部网站。
Sharepoint web爬虫没有提供足够的可配置性,因此我们一直使用快速web爬虫来运行爬虫。
但是,在Sharepoint 2013中,FAST web crawler似乎已被弃用/与Sharepoint web crawler合并。
我找不到关于如何配置2013 Web Crawler组件的重要文档。它比2010年的Sharepoint爬虫更强大吗?
我有两种不同类型的索引,它们都工作得很好,至少在本地索引的搜索预览中是这样。我将它们都添加到了索引区的智能搜索部分,一个是页面爬虫,另一个是在媒体库中搜索的自定义索引。问题是结果只与爬虫的结果相匹配,并且没有显示任何自定义索引。我认为问题出在smartSearchResults转换上,因为每次我尝试从自定义索引中添加一个字段时,都会得到一个错误,即该值不存在。我的问题是如何使用这两个索引来检索同一个web部件中的所有结果?
这就是变形的样子。
<div class="result">
<!-- Search result title --
我的web应用程序出现了以下错误:
2017-12-02 22:32:39
[10.133.0.13][-][-][error][yii\web\HttpException:404]
yii\base\InvalidRouteException: Unable to resolve the request
"assets/7adcf7ba/site.css". in
/var/www/html/my-website/vendor/yiisoft/yii2/base/Module.php:537
它是由我在HTTP_USER_AGENT中看到的引起的。文件夹7adcf7ba已经不
我正在试着做一个rest全红宝石服务。我的程序分解的方式是两个应用程序。一个是web服务爬虫,另一个是web应用程序(尚未开发),web应用程序将使用get post和常规内容向爬虫程序发出请求。
下面是一个使用curl的post请求示例
curl -d 'url=www.whatever.com&depth=10' http://127.0.0.1:8080/requests/new
工作正常,似乎发布了一个请求。
下面是删除部分
curl -x DELETE http://127.0.0.1:8080/requests/1 where 1 is id of