前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python+requests+bs4批量下载公众号PPT

Python+requests+bs4批量下载公众号PPT

作者头像
Python小屋屋主
发布2021-03-16 14:43:06
7680
发布2021-03-16 14:43:06
举报
文章被收录于专栏:Python小屋Python小屋

推荐图书:

《Python程序设计(第3版)》,(ISBN:978-7-302-55083-9),董付国,清华大学出版社,2020年6月第1次印刷,2021年1月第6次印刷,山东省一流本科课程“Python应用开发”配套教材,清华大学出版社2020年度畅销图书(本书第二版为2019、2020年度畅销图书)

目录(二级)

第1章 基础知识/1

1.1 如何选择Python版本

1.2 Python安装与简单使用

1.3 使用pip管理扩展库

1.4 Python基础知识

1.5 Python代码编写规范

1.6 Python文件名

1.7 Python程序的__name__属性

1.8 编写自己的包

1.9 Python快速入门

1.10 The Zen of Python

第2章 Python数据结构/31

2.1 列表

2.2 元组

2.3 字典

2.4 集合

2.5 其他数据结构

第3章 选择与循环/67

3.1 运算符与条件表达式

3.2 选择结构

3.3 循环结构

3.4 break和continue语句

3.5 综合运用

第4章 字符串与正则表达式/83

4.1 字符串

4.2 正则表达式

第5章 函数设计与使用/115

5.1 函数定义

5.2 形参与实参

5.3 参数类型

5.4 return语句

5.5 变量作用域

5.6 lambda表达式

5.7 案例精选

5.8 高级话题

第6章 面向对象程序设计/138

6.1 类的定义与使用

6.2 类的方法

6.3 属性

6.4 特殊方法与运算符重载

6.5 继承机制

第7章 文件操作/158

7.1 文件基本操作

7.2 文本文件基本操作

7.3 二进制文件操作

7.4 文件级操作

7.5 目录操作

7.6 案例精选

第8章 异常处理结构与程序调试/181

8.1 基本概念

8.2 Python异常类与自定义异常

8.3 Python中的异常处理结构

8.4 断言与上下文管理

8.5 使用IDLE调试代码

8.6 使用pdb模块调试程序

第9章 GUI编程/199

9.1 tkinter基础

9.2 tkinter精彩编程

第10章 网络程序设计/230

10.1 计算机网络基础知识

10.2 UDP和TCP编程

10.3 Socket编程案例精选

10.4 网页内容读取与网页爬虫

第11章 安卓平台的Python编程/248

11.1 QPython简介

11.2 安卓应用开发案例

第12章 Windows系统编程/254

12.1 注册表编程

12.2 创建可执行文件

12.3 调用外部程序

12.4 创建窗口

12.5 判断操作系统版本

12.6 系统运维

第13章 多线程与多进程编程/273

13.1 threading模块

13.2 Thread对象

13.3 线程同步技术

13.4 多进程编程

第14章 数据库编程/294

14.1 SQLite应用

14.2 访问其他类型数据库

第15章 多媒体编程/306

15.1 图形编程

15.2 图像编程

15.3 音乐编程

15.4 语音识别

15.5 视频处理和摄像头接口调用

第16章 逆向工程与软件分析/328

16.1 主流项目与插件简介

16.2 IDAPython与Immunity Debugger编程

16.3 Windows平台软件调试原理

16.4 案例精选

第17章 科学计算与可视化/349

17.1 numpy简单应用

17.2 scipy简单应用

17.3 matplotlib简单应用

17.4 数据分析模块pandas

17.5 统计分析模块statistics

第18章 密码学编程/377

18.1 安全哈希算法

18.2 对称密钥密码算法DES和AES

18.3 非对称密钥密码算法RSA与数字签名算法DSA

=======================

问题描述:

使用Python+requests+bs4编写网络爬虫程序,批量下载微信公众号“Python小屋”推送过的所有PPT图片,自动生成对应的PowerPoint文件,每篇文章的图片保存为一个PowerPoint文件。

技术路线:

手机微信关注公众号“Python小屋”,然后依次单击菜单“最新资源”==>“教学资源”,打开链接,复制地址,使用PC端浏览器打开,分析网页源代码结构,编写网络爬虫,依次获取每篇文章链接,进一步爬取链接文本中带有PPT字样的链接,下载其中的所有图片,为每篇文章创建一个PowerPoint文件并导入下载的图片。

参考代码:

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-03-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python小屋 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档