依次执行即可:
pip3 install requests
pip3 install beautifulsoup4
pip3 install lxml
首次分析
分析页面结构是必不可少的一步,只有了解到该页面如何组成才能够如何根据页面结构编写代码...通过上图的操作找到可以定位到第一个内容的元素标签及标签的属性
从上图中可以看到你选择的这个元素是用标签包起来的,下有标签,标签的属性href值就是当前内容的详细信息链接,但是它的值开头是...所以这里不取下标0,使用循环来获取每个a标签属性href的值
运行结果
运行结果如下:
可以数数是不是获取到了12个详细页面的链接,然后点进去看看是不是与自己点进去的画面显示一致....再次分析
获取到详细页面的链接后需要分析该页面的结构,咱们的下载链接也在该页面,分析完这次后就不用再分析了....,定位到该元素后展开它的子节点,看下图
从上图的黄色框框及蓝色框框中可以看出他用了两个div来展示下载链接,但是将鼠标悬浮上面后只展示了一个div的内容,我查看了其他内容的详细页面后发现都有两个,初步了解到鼠标悬浮再