Headless的浏览器我们以前经常用PhantomJS, 但随着google宣布支持headless后, PhantomJS也停止更新了,那么是时候使用headless了。
什么是Headless chrome呢?
Headless Chrome 是 Chrome 浏览器的无界面形态,可以在不打开浏览器的前提下,使用所有 Chrome 支持的特性运行你的程序。相比于现代浏览器,Headless Chrome 更加方便测试 web 应用,获得网站的截图,做爬虫抓取信息等。相比于出道较早的 PhantomJS,SlimerJS 等,Headless Chrome 则更加贴近浏览器环境.
Headless有什么好处呢?
最直观的就是由于不需界面,所以速度上比普通浏览器稍快,也不会因为误操作界面导致人为错误。另外,headless在爬虫程序,和网页截图时也经常用。
如何使用? chrome 的headless模式实现起来很简单,无需下载, 只要你运行的机器上有最新版的chrome即可(事实上59版本以后都支持), 当然了你需要crhome driver在你python安装路径的根目录下。。 下面我们以百度首页为例,打印出搜索框的文本“百度一下”。