提供接口来打开网页,下载资源
BeautifulSoup....解析网页,提取信息
缺少哪个py库,用pip install xx 来安装
分析与设计
分析过程
人工打开几个目标网页,查看网页源代码来分析下规律,即如何通过主网页,一步步跳转到最终的资源链接....href即是一个演讲的链接地址
这里要注意给出的链接是需要补齐前缀的
针对每一个具体的演讲的网页,基本都提供了一个音频的播放器
只要点击下载图标按钮,就会切换到另一个网页
分析音频播放器下载按钮的链接,...') ;
});
$(".anniu").click(function(){
$(".download").hide();
});
$("a[id^='jplayer_tc...,即是一个单独的任务
对每个任务,解析js中window.open后跟的链接,即是最终的资源所在;分别下载mp3和lrc即可
伪码
main_url = "xxx.html"
for td_tag in