那些好用的word处理包都无法使用, 难度一下子就上来了..... 好歹有python3 (py2的话,难度更上一层楼.)注: 由于代码都是在内网写的, 无法提供完整的例子了....本文主要偏向于一些xml处理word/xlsx的坑.分析docx 是doc的扩展, xlsx是xls的扩展, 都是为了和其它厂商竞争为了兼容性才出现的标准格式....打开xml文件(直接把xml文件拖到浏览器就行) 会看到一个类似如下的格式这是一个xml文件, 我们可以使用 python 的xml.dom.minidom 来解析这个文件由于是zip文件的, 所以得先用...就是字符串列表.这个文件主要是记录那些共享值, 所以这里的值尽量唯一. index就是sheet里面记录的值, 所以这个位置也很重要.基本上就是遍历一下, 再shardStrings里面就返回index...虽然python自带的xml能操作docx和xlsx文档, 但不建议这么做, 太痛苦了. 2. 实际编写代码的时候, 要根据自己的情况抽象出多个方法, 这样写起来就方便些.