使用新的搜索控制台通过R获取Googlebot爬行错误

r、google-search-console

所以问题是，我有一个代码运行得很好的自动化，得到了谷歌机器人爬行错误的数量。为此，我使用了SearchconsoleR包。最近，我假设由于搜索控制台的变化，这将不再起作用。Errors <- crawl_errors(website, category = "all", platform = c("web"), latestCountsOnly = T) 现在我得到了以下错误代码(rig

浏览 9提问于2019-05-15得票数 0

回答已采纳

3回答

停止谷歌机器人不止一次爬行URL？

seo、web-crawlers、googlebot、crawl-rate

最近，我的专用服务器已经崩溃，因为googlebot爬行网站太频繁。根据搜索控制台，很多天googlebot每天都会爬行数万次，这表明他们一直在抓取他们已经爬过的页面。我知道我可以限制googlebot爬行率，但是是否有可能强迫googlebot只爬行一次和一次？ 📷

浏览 0提问于2019-08-08得票数 2

回答已采纳

1回答

谷歌为什么要抓取不存在的URL？

google、googlebot、links、crawl-errors

我可以看到在我的wordpress网站的实时流量，眼镜机器人爬行不存在的网页。pg=15&order=lcomdate&dtype=prosfata&listview=1还有一个问题。最近，我增加了缓存到我的网站。为了更快的速度，谷歌不应该在缓存的

浏览 0提问于2017-05-19得票数 2

1回答

具有单击处理程序和href属性的链接，哪个是由Googlebot调用的？

seo、javascript

我的站点上有以下锚代码：对于人类用户，onclick将在不刷新页面的情况下使用AJAX获取数据。目前，Googlebot在看到这个链接时的行为是什么？它是否会忽略onclick，直接转到href中给出的页面，或者处理onclick，或者在索引我的</

浏览 0提问于2018-04-19得票数 1

1回答

Googlebots请求类型

web-crawlers、googlebot、404、http-headers、soft-404

谷歌的机器人是否发送头部请求以及接收请求？Connection: closeServer: TornadoServer/4.2.1 我怀疑Googlebots也在为一些爬行者做同样的事情这是对的吗？

浏览 0提问于2016-03-10得票数 3

回答已采纳

2回答

索引参数(如果它们提供内容过滤)，则不进行索引。

seo、google

我已经创建了一个关于销售汽车的网站，访问者可以过滤掉结果，这意味着很多页面都会被Google索引。我的问题是，我是否应该允许索引所有这些过滤器URL参数？

浏览 0提问于2017-02-25得票数 4

2回答

从HTTP移动到HTTPS并抓取请求

seo、google、https、search

我已经将我的网站从http移到https，http被完全重定向到https，并且它们在内容上是相同的。我已经在Google搜索控制台中添加了这两个属性，当我要求Google进行爬行(在搜索控制台中获取作为Google选项)时，我是为https还是为http，还是为两者？

浏览 0提问于2019-02-09得票数 1

2回答

你能知道谷歌何时会派Googlebot去爬行你的网站吗？

web-crawlers、googlebot、crawl-rate

我可以找到最后一个日期，当谷歌爬行我的网站，但我找不到下一个爬行日期。有什么地方可以让我看看Googlebot什么时候才能回来？

浏览 0提问于2016-02-24得票数 1

4回答

Googlebot要花多长时间才能抓取一个页面？

seo、googlebot、technical-seo

Googlebot每天爬行一定数量的页面，这取决于站点的大小。但是，对于一个特定的页面需要多长时间。换句话说，在扫描到下一页之前，它在当前扫描页面上花费了多少秒或分钟。这有固定的时间吗？

浏览 0提问于2022-07-25得票数 2

1回答

Googlebot执行谷歌标签管理器吗？

seo、googlebot、javascript、google-tag-manager

我想了解Googlebot (和其他爬虫)如何爬行我的网站。具体而言，它是否传递一个document.referrer，如果它维护localStorage密钥，那么我通过Google实现了一个脚本，该脚本检测这些爬虫并将数据记录到Logstash。Slurp') < 0) { } else { }这是通过GTM Pageview事件上的图像像素向Logstash在过去4天里<e

浏览 0提问于2018-02-09得票数 4

回答已采纳

2回答

如何让谷歌去索引所有现在返回404状态的旧URL？

google、search-engine-indexing、404、migration

现在，每当人们在Google上搜索时，搜索结果中出现的旧URL就无法工作。URL显示404个错误。该网站大约有10万种产品，因此重定向所有旧的URL是一个漫长的过程。

浏览 0提问于2019-02-05得票数 2

2回答

为什么Googlebot要用GET而不是POST来调用AJAX方法？

googlebot、404、http、ajax

我的站点上有一个AJAX调用，用于发布并返回数据。Googlebot正在爬行这些URL，但它试图使用GET方法而不是POST。这将导致谷歌搜索控制台中出现数百条404错误消息。有什么最佳做法吗？我应该使用HTTP和POST方法来纠正这404错误吗？

浏览 0提问于2016-07-19得票数 3

1回答

如何找到Googlebot爬行URL的引用者？

google、web-crawlers、googlebot、search-results

Googlebot从我的网站上抓取了404个URL。我想知道从哪里得到这些链接？example.com/no_such_files.php我想知道Googlebot是从哪里得到这些链接的？我最近看到了很多像上面这样的URL。

浏览 0提问于2017-12-12得票数 3

1回答

如何让Google不使用#来抓取AJAX页面！URL？

seo、search-engines、google-search、ajax

在谷歌关于“使AJAX应用程序可爬行”的建议中，他们建议制作不使用散列片段的AJAX URL (#!)可以通过将<meta name="fragment" content="!">添加到页面<head>来进行爬行。有人成功了吗？我找不到Googlebot在网站管理员工具中使用“获取作为Googlebot”来获取页面的HTML快照。

浏览 0提问于2011-08-25得票数 14

3回答

onclick处理程序代替链接的SEO影响

web-crawlers、googlebot、javascript、react-js

我有一个类似于这里发布的问题。我正在构建一个具有非常严格的SEO要求的React应用程序，所以我想知道以下方法是否是一个问题：谷歌机器人能处理这个吗？即使它可以，我有一种感觉，它可能会影响爬虫的能力，以正确索引链接结构在应用程序。这样，爬

浏览 0提问于2018-03-13得票数 4

回答已采纳

1回答

伤害我的搜索引擎优化:我的网页确实存在，但我得到404的地位在几页。为什么？

seo、google-search-console、seo-audit、dead-links

我真的需要你的帮助来解决这个问题，我的排名下降了，我被诊断出来了，谷歌网站管理员工具中大约有80到404页。它们都存在。

浏览 0提问于2014-12-16得票数 1

回答已采纳

1回答

我如何构造我的进步的web应用程序，使搜索引擎更容易找到用户生成的内容？

url、url-encoding、react-js

超级菜鸟的问题，我肯定，但这是我第一次建立一个面向消费者的网络应用。为了避免因复制而关闭，此问题非常专门针对React + GraphQL。我正在创建一个网站，它将有大量的用户生成的内容，这是非常重要的是，内容是优化，以找到搜索引擎。但是，内容将存储在某个数据库中，并通过GraphQL查询获取。如何构造我的web应用程序，使搜索引擎更容易找到用户生成的内容？从一开始就需要遵循哪些体系结构决策和模式？

浏览 0提问于2018-10-25得票数 1

1回答

Google会用其他嵌套的HTML元素来抓取链接吗？

google-search-console、web-crawlers

我有这样的链接 <div class="container"> </div>在谷歌搜索控制台上，它说some/relative/link是谷歌所不知道的。从主页被爬行和索引开始不到一天，我在大约12小时前提交了这个主页以供索引，因为网站

浏览 0提问于2022-07-12得票数 1

回答已采纳

2回答

使用GoDaddy管理的Wordpress托管和Cloudflare的Google工具中的许多"429“爬行错误

google-search-console、wordpress、godaddy、cloudflare

以下设置：Cloudflare作为CDN 工具显示了所有带有429爬行错误的页面。造成这一问题的更可能的原因是什么？如何进行最佳调试？

浏览 0提问于2014-11-25得票数 5

回答已采纳

1回答

将我的网站标记为单一页面应用程序？

seo、google-search-console、googlebot、canonical-url、single-page-application

是否有可能将我的网站标记为SPA？我之所以想这么做，是因为在Google搜索控制台上，我看到我的链接没有正则链接，但是如果我尝试使用一个活动版本，爬虫就会看到我的规范链接。我得出的唯一结论是，Google使用的是不同的爬虫器，其中一个可以读取SPA，而另一个不能。这有道理吗？有什么方法可以告诉Google总是使用爬虫来渲染SPA，从而确保它索引我的链接正确(与规范链接)？

浏览 0提问于2019-05-02得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

停止谷歌机器人不止一次爬行URL？

谷歌为什么要抓取不存在的URL？

具有单击处理程序和href属性的链接，哪个是由Googlebot调用的？

Googlebots请求类型

索引参数(如果它们提供内容过滤)，则不进行索引。

从HTTP移动到HTTPS并抓取请求

你能知道谷歌何时会派Googlebot去爬行你的网站吗？

Googlebot要花多长时间才能抓取一个页面？

Googlebot执行谷歌标签管理器吗？

如何让谷歌去索引所有现在返回404状态的旧URL？

为什么Googlebot要用GET而不是POST来调用AJAX方法？

如何找到Googlebot爬行URL的引用者？

如何让Google不使用#来抓取AJAX页面！URL？

onclick处理程序代替链接的SEO影响

伤害我的搜索引擎优化:我的网页确实存在，但我得到404的地位在几页。为什么？

我如何构造我的进步的web应用程序，使搜索引擎更容易找到用户生成的内容？

Google会用其他嵌套的HTML元素来抓取链接吗？

使用GoDaddy管理的Wordpress托管和Cloudflare的Google工具中的许多"429“爬行错误

将我的网站标记为单一页面应用程序？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐