总之, 这里通过使用一些库, Python的python-docx, C#的pdfbox和npoi, 来让对Word和PDF的处理变得更加自动化一些.....NET)来访问POI的功能....]
-----
NPOI提取Word内容
其实NPOI非常强大, 足以用来做和Word有关的一切了, 但是, 这里只演示一下提取Word中的内容, 因为后面有python-docx这样更加轻巧的库, 不需要...vs不需要Windows, 你就可以处理docx类型的文件了....从样式修改, 表格合并处理这些难点来谈. 后续也会逐步更新新遇到的坑.