首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Python爬虫。解析和执行ajax

Python爬虫。解析和执行ajax
EN

Stack Overflow用户
提问于 2012-01-26 02:57:58
回答 1查看 2.4K关注 0票数 2

我有一个爬虫的基本结构。现在我在一些php驱动的网站上发布了它,它就像一个护身符。不过,现在我想让它从ajax内容构建数据表。

目前,我正在使用Mechanize for PYTHON和perl来构建我的爬虫。虽然机械化模块不执行AJAX。如何访问由异步ajax构建的内容?

我知道有一种叫做Selenium的东西,一种真正的自动化浏览器。但这是我唯一的选择吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-01-26 03:01:41

你可以运行一个无头浏览器,例如理解JavaScript、DOM等的phantomjs,但你必须用Javascript编写代码,好处是你可以做任何你想做的事情。

还有另一种方法,但它的messy

当你点击按钮(使用Firefox中的Firebug或Chrome中的开发者工具)时,你可以观察到发出了什么请求。然后,尝试对页面后面运行的javascript进行反向工程,并尝试使用python代码执行类似的操作,请看一下Spidermonkey

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9008534

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档