总之, 这里通过使用一些库, Python的python-docx, C#的pdfbox和npoi, 来让对Word和PDF的处理变得更加自动化一些。...这里可以用C#的NPOI和python-docx实现....NPOI提取Word内容
其实NPOI非常强大, 足以用来做和Word有关的一切了, 但是, 这里只演示一下提取Word中的内容, 因为后面有python-docx这样更加轻巧的库, 不需要vs不需要..., 然后循环读取Word内容写入缓存, 最后转码成gb2312到输出文件....所以, 这里要特别注意, 如果通过样式填充, 就不用再用text字段进行赋值。
?
单元格合并
比如我现在建立一张表,尝试合并。