任务描述:
检查Word文件中包含特定关键字的所有页码。
基本思路:
Word文件属于流式文件,在没有打开之前难以确定页码,可以考虑临时转换为PDF文件,这样就可以确定页码了,再逐页提取PDF文件中的文字,如果包含特定关键字就输出相应的页码。
参考代码: