首页
学习
活动
专区
工具
TVP
发布
您找到你想要的搜索结果了吗?
是的
没有找到

爬虫遇到js动态渲染问题

爬虫遇到js动态渲染问题 时间:2020年6月3日10:28:48 作者:钟健 概要:关于scrapy爬虫应对网页JavaScript动态渲染问题 关键字:scrapy crapy-splash...一、传统爬虫的问题 scrapy爬虫与传统爬虫一样,都是通过访问服务器端的网页,获取网页内容,最终都是通过对于网页内容的分析来获取数据,这样的弊端就在于他更适用于静态网页的爬取,而面对js渲染的动态网页就有点力不从心了...,因为通过js渲染出来的动态网页的内容与网页文件内容是不一样的。...做的动态渲染,所有数据都在js中间,这就使我们无法对于网页的结构进行分析来进行爬取数据 那我们如何,获取到它实际显示的页面,然后对页面内容进行分析呢?...其实大部分的动态网页的渲染,都存在与数据端进行请求交互数据,当然也存在一些,直接把数据存在js中间,然后再通过js渲染到网页上,这时候scrapy-splash就可以发挥价值了,尤其是在一些验证码,图形验证方面更加突出

1.9K20
领券