首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何使用wget下载整个动态页面?

如何使用wget下载整个动态页面?
EN

Stack Overflow用户
提问于 2018-10-12 01:29:07
回答 1查看 431关注 0票数 1

例如,我正在尝试使用Linux中的wget命令从网站下载一个页面,我想要的是包含在该页面的html代码中的信息。

我试过使用R的Rvest和Python的美汤,但它不起作用,所以现在我尝试wget,主要是我在.css和.js中得到的脚本,我不能从中提取有用的信息(据我所知),所以总而言之,我想从一个动态网站上使用wget命令提取a的信息。

我已经使用了-F,-i和其他一些参数,请记住,我对计算机科学和Linux总体来说是相当新的,所以如果这个问题是微不足道的,请解释一下,谢谢。

此外,如果有必要,我可以发布我到目前为止所做的事情。

EN

回答 1

Stack Overflow用户

发布于 2020-08-08 08:54:54

使用VBA和https://phantomjs.org/

代码语言:javascript
运行
复制
sDir = ThisWorkbook.Path
sCmd = "cmd.exe /K cd """ & sDir & """ & phantomjs.exe phm_save.js " & sURL & " > " & sFile
pid = Shell(sCmd, vbHide)

phm_save.js

代码语言:javascript
运行
复制
   var system = require('system');
   var page = require('webpage').create();

   page.open(system.args[1], function(){
       console.log(page.content);
       phantom.exit();
    }
   );
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52765871

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档