总之, 这里通过使用一些库, Python的python-docx, C#的pdfbox和npoi, 来让对Word和PDF的处理变得更加自动化一些....这里可以用C#的NPOI和python-docx实现.
-----
NPOI
NPOI安装
来看下维基的介绍....虽然之前写Unity游戏的时候用过一些C#, 但是这次是我第一次从软件开发的角度使用C#, 不得不说, NuGet令我印象深刻, 很好用....-----
读取PDF内容
同样, 这次用的是C#的库, 名为Pdfbox....从样式修改, 表格合并处理这些难点来谈. 后续也会逐步更新新遇到的坑.