总之, 这里通过使用一些库, Python的python-docx, C#的pdfbox和npoi, 来让对Word和PDF的处理变得更加自动化一些....这里可以用C#的NPOI和python-docx实现.
-----
NPOI
NPOI安装
来看下维基的介绍....虽然之前写Unity游戏的时候用过一些C#, 但是这次是我第一次从软件开发的角度使用C#, 不得不说, NuGet令我印象深刻, 很好用....至少你应该把DLL打包进EXE或DLL.
你可以把DLL作为资源文件进行打包, 但是这样不优雅, 很土. 同样, 我们用9102年应该用的方法....-----
读取PDF内容
同样, 这次用的是C#的库, 名为Pdfbox.