首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >在C#中从PDF中提取文本

在C#中从PDF中提取文本
EN

Stack Overflow用户
提问于 2010-01-22 18:05:06
回答 3查看 71.7K关注 0票数 31

很简单,我需要从多个PDF中抓取文本(实际上相当多),以便在将其粘贴到SQL数据库之前分析内容。

我发现了一些相当粗略的免费C#库可以工作(最好的是使用iTextSharp),但是有无数的格式错误,一些字符被打乱,很多时候到处都是空格(‘') -单词内部,每个字母之间,大块的空格占据了几行,这一切看起来都有点随机。

有没有什么简单的方法可以做到这一点,我完全忽略了(很有可能!)或者这是一项需要将提取的字节值可靠地转换为字母的艰巨任务?

EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2116440

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档