当我搜索一个项目时,谷歌会推荐PDF格式的结果。谷歌如何识别PDF内容?在我的网站上使用PDF文件的内容有什么问题吗?该网站的内容是否会被谷歌识别为重复内容?会不会对网站的搜索引擎优化产生负面影响?谢谢。
发布于 2018-10-19 21:54:16
在大多数方面,Google对待PDF的文本内容就像对待普通网页一样。他们告诉什么是PDF的方式是通过服务器发送的HTTP头,就像普通的web页面一样,他们使用基于传入链接的web爬虫来发现它。
如果PDF是来自同一个域的自己的内容,他们可能会对重复的内容问题松懈。网站通常都会以HTML和PDF格式发布信息,特别是那些需要打印的内容,比如简历和讲义。理想情况下,您可以在指向PDF版本的HTML中设置一个meta alternate
标记,但即使这样也可能会导致过度。
如果您正在复制的PDF是来自另一个领域,很可能他们会注意到,有可能他们会打你“模仿”的惩罚。我不会指望PDF格式来规避谷歌的版权/所有权过滤器。
https://webmasters.stackexchange.com/questions/118536
复制相似问题