我想访问Office2003文件(.doc、.xls和.ppt),以便提取文本和一些元数据(字数、页数、图片、模板等)。我可以使用Open XML SDK for office 2007文档来做到这一点。然而,这个提取将发生在服务器上,服务器不能安装像Microsoft Office这样的应用程序(这就是我不能使用Office的Interop的原因)。我尝试过NPOI,但实际上它只支持.xls文件。我发现的其他库不是开源的,我不能在我的工作中使用它……我下载了NPOI Scratchpad,但代码非常“原始”,我不能在工作中使用它。您是否有从Office2003文档中获取文本和元数据的其他想法