腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
Python小屋
专栏作者
举报
961
文章
1631368
阅读量
146
订阅数
订阅专栏
申请加入专栏
全部文章
python
其他
编程算法
面向对象编程
程序
matplotlib
numpy
数据库
爬虫
tkinter
http
游戏
windows
opengl
api
正则表达式
html
程序设计
设计
sql
shell
https
视频
对象
android
sqlite
人工智能
图像处理
函数
算法
动画
mp4
pandas
机器学习
网站
存储
gui
数据可视化
pdf
word
测试
可视化
django
udp
安全
cmd
excel
后台
java
微信
数据分析
基础
统计
微信公众号
打包
神经网络
大数据
腾讯云开发者社区
docx
pip
xlsx
公众号
工作
排序
源码
xml
嵌入式
git
matlab
linux
windows server
深度学习
访问管理
容器
缓存
网络安全
spark
opencv
二叉树
selenium
anaconda
验证码
dataframe
powerpoint
服务端
集合
数据
推送
效率
音频
原理
字符串
tensorflow
c++
php
json
mapreduce
文件存储
腾讯云测试服务
视频处理
开源
erp
决策树
scrapy
markdown
socket编程
数据结构
nat
腾讯云图数据可视化
label
png
pywin32
编程
遍历
表格
队列
多进程
计算机图形学
开发
客户端
事件
手机
数学
线程
指针
对象存储
语音识别
官方文档
数据挖掘
javascript
go
.net
css
jquery
typescript
qt
汇编语言
云数据库 SQL Server
云数据库 Redis
access
ruby on rails
ide
github
ubuntu
日志服务
文字识别
mongodb
渲染
xslt & xpath
serverless
分布式
自动化
html5
jdk
ssh
卷积神经网络
强化学习
监督学习
ftp
grep
tcp/ip
无监督学习
小程序
机器人
数据处理
unicode
utf8
ascii
数据脱敏
工商注册
汽车
append
bmp
casting
count
data
decorator
dpi
ffmpeg
file
filter
flush
gif
imagemagick
input
key
mask
math
multiprocessing
openpyxl
path
plot
pyaudio
pyinstaller
python3
queue
reportlab
smtp
spyder
stdout
treeview
win10
编辑器
变量
编码
代码优化
登录
递归
二进制
二维码
服务
管理
继承
接口
连接
排序算法
配置
数据采集
数组
搜索
特效
通信
协议
压缩
异常
优化
字符编码
解释器
搜索文章
搜索
搜索
关闭
Python使用标准库zipfile+re提取docx文档中超链接文本和链接地址
python
windows server
xml
WPS和Office Word创建的docx格式文档虽然格式大致相同,但还是有些细节的区别。例如,使用WPS创建的文档中如果包含超链接,可以使用“Python提取Word文档中所有超链接地址和文本”一文中介绍的技术和代码提取,但是同样的代码对于Office Word创建的docx文档无效。本文使用Python配合正则表达式来提取docx文档中的超链接文本和链接地址。
Python小屋屋主
2020-09-23
1.6K
0
Python提取docx文档中嵌入式图片和浮动图片的又一种方法
xml
嵌入式
python
昨天推送了使用docx2python扩展库提取文档中图片的文章之后,经网友perfect提醒,实际上使用python-docx这个扩展库也可以提取浮动图片,并给出了参考代码。经过分析和测试,确实可以,然后根据分析我把perfect朋友给出的代码又简化改进了一下,思路如下:
Python小屋屋主
2019-11-28
2.5K
0
Python爬虫扩展库BeautifulSoup4用法精要
python
爬虫
html
xml
https
BeautifulSoup是一个非常优秀的Python扩展库,可以用来从HTML或XML文件中提取我们感兴趣的数据,并且允许指定使用不同的解析器。由于beautifulsoup3已经不再继续维护,因此新的项目中应使用beautifulsoup4,目前最新版本是4.5.0,可以使用pip install beautifulsoup4直接进行安装,安装之后应使用from bs4 import BeautifulSoup导入并使用。下面我们就一起来简单看一下BeautifulSoup4的强大功能,更加详细完整的学
Python小屋屋主
2018-04-16
711
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档