码迷,mamicode.com
首页 > Windows程序 > 详细

C#仪器数据文件解析-PDF文件

时间:2017-10-11 21:57:07      阅读:227      评论:0      收藏:0      [点我收藏+]

标签:c#   ++   fread   builder   规则   常用   extract   读取   解析   

不少仪器工作站输出的数据报告文件为PDF格式,PDF格式用于排版打印,但不易于数据解析,因此解析PDF数据需要首先读取到PDF文件中的文本内容,然后根据内容规则解析有意义的数据信息。

C#解析PDF文件常用的库有PDFBox和iTextSharp,PDFBox为Java库,通过IKVM使用,因此调用方法、属性等比较变扭。

PDFBox解析PDF文本示例:

 PDDocument doc = PDDocument.load(input);
 str = new PDFTextStripper().getText(doc);
 doc.close();

iTextSharp解析PDF文本示例:

PdfReader reader= new PdfReader(fileName);
  for (int pageNumber = 1; pageNumber <= reader.NumberOfPages; ++pageNumber)
                    stringBuilder.AppendLine(PdfTextExtractor.GetTextFromPage(reader, pageNumber));
reader.Close();

C#仪器数据文件解析-PDF文件

标签:c#   ++   fread   builder   规则   常用   extract   读取   解析   

原文地址:http://www.cnblogs.com/mahongbiao/p/7652788.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!