任务描述:
提取docx文档中超链接文本和地址。
WPS和Word都可以创建docx文档,生成的文档表面看上去并没有什么区别并且可以互相识别,但内部结构一些细微区别会导致自己编程处理时难以通用。下面第一个链接中的代码适用于Word创建的docx文档,第二个链接适用于WPS创建的docx文档。
本文再分别给出一个不同的方法来实现同样功能,参考代码:
分别使用WPS和Word创建两个文档,里面放一些超链接,内容略有不同,输出结果如下:
本文分享自 Python小屋 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!