我想抓取一个网站,问题是,它充满了JavaScript的东西,如按钮等,当它们被按下时,他们不会改变网址,但页面上的数据是改变的。
我通常使用LWP / Mechanize等来抓取站点,但都不支持JavaScript。有什么想法吗?
发布于 2010-09-22 20:55:20
另一个选项可能是带有WWW::Selenium模块的Selenium
发布于 2010-09-22 20:35:48
WWW::Scripter模块有一个可能有用的JavaScript plugin。然而,我不能说我自己也用过它。
发布于 2010-09-22 23:40:31
WWW::Mechanize::Firefox可能会有用。这样你就可以让火狐处理复杂的JavaScript问题,然后提取出结果html。
https://stackoverflow.com/questions/3769015
复制相似问题