我需要一个相当容易使用的无头浏览器(我仍然是Python和一般编程的新手),它将允许我导航到一个页面,登录到一个需要Javascript的表单,然后通过搜索匹配某些条件的结果,点击复选框,并点击下载文件来抓取结果网页。所有这些都需要Javascript。
我听说我想要一个无头浏览器--要求/偏好是我能够在Python中运行它,并且最好生成的脚本可以由py2exe编译(我正在为其他用户编写这个程序)。
到目前为止,风车看起来可能是我想要的,但我不确定。
任何想法都很感谢!
发布于 2011-11-10 02:21:25
这个问题的答案是Spynner
发布于 2011-05-17 12:11:15
我通过pyqt /pyside在Python中使用webkit作为无头浏览器:
http://www.riverbankcomputing.co.uk/software/pyqt/download
http://developer.qt.nokia.com/wiki/Category:LanguageBindings::PySide::Downloads
我特别喜欢webkit,因为它设置起来很简单。对于Ubuntu,您只需使用:sudo apt-get install python-qt4
下面是一个示例脚本:
http://webscraping.com/blog/Scraping-JavaScript-webpages-with-webkit/
发布于 2011-06-09 12:00:35
我正在为Zombie.js编写Python驱动程序,“一个在模拟环境中测试客户端JavaScript代码的轻量级框架”。
我目前还没有解决Node.js中的一个bug (在我写更多测试和更多代码之前),但请随时关注我的项目进展:
https://stackoverflow.com/questions/6025082
复制相似问题