我在前端使用mithril框架将我的博客创建为单页面应用程序。为了进行查询,我在后端使用了rest API和Django。由于所有内容都是使用javascript代码呈现的,当爬虫访问我的博客时,它们看到的只是一个空页面。更重要的是,例如,每当我在社交媒体上分享帖子时,Facebook看到的只是一个空白页面,而不是帖子的内容和标题。我正在考虑查看用户代理,每当用户代理来自爬虫时,我都会将页面的渲染版本提供给它,但我在实现上述方法时遇到了问题。
为网络爬虫创建一个在后台SEO友好的rest API和Django的单页应用程序的最佳实践是什么?
发布于 2017-08-24 07:40:09
我现在正在做一个项目,我非常推荐使用Node而不是Python,如下所示:
发布于 2017-08-16 13:47:52
您可能希望查看爬行器访问的页面的服务器端呈现。
Here is a good article on Client Side vs Server Side
我以前没有听说过Mithril,但你可能会发现一些插件可以帮你做到这一点。
发布于 2020-10-06 21:10:36
这可能会对你有所帮助:https://github.com/sharjeel619/SPA-SEO
上面的示例是使用Node/Express创建的,但是您可以在Django服务器上使用相同的逻辑。
逻辑
然后,只需从单页application.的build或dist文件夹返回文件
https://stackoverflow.com/questions/45705644
复制相似问题