我有一个drupal front_page,它可以编辑从博客到头版的所有匿名用户。但我希望facebook上的clawler能看到我的og: data,发布带有当前标题的评论。脸书爬虫获得了302的正面,并采取标题从头版。
我怎样才能(也许)做一个白名单给facebook爬虫获取og:来自受限区域的数据?
发布于 2012-08-12 22:11:43
我不知道您是如何进行重定向的,但是Facebook会发送一个用户代理字符串来向它的机器人/爬虫发送信号,所以您可以这样做:
if (strpos($_SERVER['HTTP_USER_AGENT'], 'facebookexternalhit')!==FALSE) {
// DON'T REDIRECT, we're facebook crawling around...
} else {
// REDIRECT, we are another bot or a user, etc...
}
发布于 2012-08-12 21:15:51
这取决于你是如何重定向的。规矩?然后添加测试用户代理并确定它是否不是FB爬虫的条件。如果您不喜欢PHP代码段,可以通过检查上下文来测试用户代理。
https://drupal.stackexchange.com/questions/39643
复制相似问题