我正在尝试从word文档中提取一个特定的表格,该表格紧跟在标题“缩写列表”之后,并在.docx文件中紧跟在标题“图形研究”之后的图像。我已经能够使用python-docx代码提取标题,但是如何使用标题或它们的位置解析文档来检索图像和我正在使用if re.match("Graphical", img.previous_sibling.text我的python docx代码是: from docx i
我实际上将我的.docx文档转换为超文本标记语言,因为我希望所有的标题和副标题都存储在单独的文件中,因为稍后我想要重现相同的文件(但删除一些内容),所以我的想法是,我将解析一次超文本标记语言,并存储它的所有标题和子标题一次text some text
Some text some text some text
我希望它们保存在不同的文件夹中,