前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >C#仪器数据文件解析-PDF文件

C#仪器数据文件解析-PDF文件

作者头像
用户1637609
发布2018-04-12 15:44:58
1.2K0
发布2018-04-12 15:44:58
举报
文章被收录于专栏:马洪彪马洪彪

不少仪器工作站输出的数据报告文件为PDF格式,PDF格式用于排版打印,但不易于数据解析,因此解析PDF数据需要首先读取到PDF文件中的文本内容,然后根据内容规则解析有意义的数据信息。

C#解析PDF文件常用的库有PDFBox和iTextSharp,PDFBox为Java库,通过IKVM使用,因此调用方法、属性等比较变扭。

PDFBox解析PDF文本示例:

代码语言:javascript
复制
 PDDocument doc = PDDocument.load(input);
 str = new PDFTextStripper().getText(doc);
 doc.close();

iTextSharp解析PDF文本示例:

代码语言:javascript
复制
PdfReader reader= new PdfReader(fileName);
  for (int pageNumber = 1; pageNumber <= reader.NumberOfPages; ++pageNumber)
                    stringBuilder.AppendLine(PdfTextExtractor.GetTextFromPage(reader, pageNumber));
reader.Close();
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017-10-11 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档