C#解析PDF的方式有很多,比较好用的有ITestSharp和PdfBox。PDF内容页如果是图片类型,例如扫描件,则需要进行OCR(光学字符识别)。文本内容的PDF文档,解析的过程中,我目前仅发现能以字符串的形式读取的,不能够读取其中的表格。据说PDF文档结构中是没有表格概念的,因此这个自然是读不...
分类:
其他好文 时间:
2014-05-31 08:15:15
阅读次数:
1196
http://pdfbox.apache.org/downloads.html
分类:
其他好文 时间:
2014-05-08 19:47:47
阅读次数:
197