我想从下面的页面抓取卫星位置,但我不确定抓取是否合适,因为页面似乎每秒钟都在使用一些内部代码更新自己(在我与互联网断开连接后,它一直在更新)。我在Stackexchange的问题中可以找到背景信息:一种更好的下载Orbcomm-2卫星位置的方法。
我需要同时包含四项内容的“快照”:
世界协调时time
time
现在我用屏幕截图和手工打字。由于这些值是通过页面更新的--传统的web抓取在这里会起作用吗?我发现了一个“屏幕刮擦”标签,我应该试着去了解它吗?
我正在寻找获得这四个值的最简单的解决方案,我想知道我是否可以使用urllib或urllib2来避免安装新的东西?
示例页面:http://www.satview.org/?sat_id=41186U我需要做41179U到41189U (11颗SpaceX刚刚送入轨道的Orbcomm-2卫星)
发布于 2021-06-07 06:20:49
这些值是使用javascript计算的。详细计算如下:https://www.satview.org/track.js
因此,我想有一个选项是用您选择的语言编写这个脚本(加上任何依赖项),并使用它返回您想要的值。
有一个主要的函数track()
,它采用arg $modo
,它可以是两个值之一- tic
或plot
。
可能还有引用的其他源文件(依赖项):
更简单的方法可能是使用一些允许javascript运行的东西,例如,使浏览器自动化,并在生成值时提取计算值。
https://stackoverflow.com/questions/67865871
复制相似问题