首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在以主动方式更改内容的网站上刮取数据?

如何在以主动方式更改内容的网站上刮取数据?
EN

Stack Overflow用户
提问于 2021-06-07 04:15:48
回答 1查看 34关注 0票数 0

我想从下面的页面抓取卫星位置,但我不确定抓取是否合适,因为页面似乎每秒钟都在使用一些内部代码更新自己(在我与互联网断开连接后,它一直在更新)。我在Stackexchange的问题中可以找到背景信息:一种更好的下载Orbcomm-2卫星位置的方法。

我需要同时包含四项内容的“快照”:

世界协调时time

  • latitude

  • longitude

  • altitude

time

  • latitude

  • longitude

  • altitude

现在我用屏幕截图和手工打字。由于这些值是通过页面更新的--传统的web抓取在这里会起作用吗?我发现了一个“屏幕刮擦”标签,我应该试着去了解它吗?

我正在寻找获得这四个值的最简单的解决方案,我想知道我是否可以使用urllib或urllib2来避免安装新的东西?

示例页面:http://www.satview.org/?sat_id=41186U我需要做41179U到41189U (11颗SpaceX刚刚送入轨道的Orbcomm-2卫星)

EN

回答 1

Stack Overflow用户

发布于 2021-06-07 06:20:49

这些值是使用javascript计算的。详细计算如下:https://www.satview.org/track.js

因此,我想有一个选项是用您选择的语言编写这个脚本(加上任何依赖项),并使用它返回您想要的值。

有一个主要的函数track(),它采用arg $modo,它可以是两个值之一- ticplot

可能还有引用的其他源文件(依赖项):

更简单的方法可能是使用一些允许javascript运行的东西,例如,使浏览器自动化,并在生成值时提取计算值。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67865871

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档