我有一个非常独特的情况,我不相信这里的任何其他话题都可以联系起来。
我有一个电子商务模块,是动态加载/嵌入到第三方网站,没有iframe直接的JSON到web客户端的内容。除了我的javascript文件从它们的页面加载并动态生成内容之外,我根本无法访问这些第三方站点。
我知道#!方法,但这在这里不好,我的JS确实在嵌入式平台中生成"urls“,但它们是假的,并且仅用于地址栏,我不相信google爬虫能到达这么远。
所以我的问题是,有没有一个元可以设置为指向url之外的地方,即返回到我的服务器上的静态爬虫内容。例如,将规范指向我的服务器...但我再说一次,我认为这是行不通的。
发布于 2013-03-03 00:11:58
如果你实现了#!然后你必须确保你嵌入的url支持片段参数版本,这可能你做不到,这是服务器端的东西。
您可能也不能影响页面的规范标记。这也必须在服务器端完成。你通过JavaScript设置的任何元标签都不会被机器人看到。
Disqus解决了这个问题,提供了一个API,这样嵌入的网站就可以在那里获得评论服务器端,然后以纯html格式呈现。WordPress有一个插件可以做到这一点。Disqus也是Google开发出的少数几个能够抓取AJAX页面的系统之一。
一些插件还要求用户包含一个与JavaScript的普通链接。注意这一点,因为如果你做错了,你可能会违反谷歌的指导方针。但是你可以将普通链接集成到你的插件中,这样它就可以将机器人和用户引导到一个可抓取的内容版本。
发布于 2013-03-02 10:02:23
看看Google's crawlable ajax standard (和why it's a bad idea)和canonical URLs。
发布于 2014-12-07 05:20:14
现在你可以实际做到这一点了。可以在这里找到完整的指南和示例:https://github.com/kubrickology/Logical-escaped_fragment
https://stackoverflow.com/questions/15169824
复制相似问题