众所周知,这是一个出色的字符识别软件。这个开源项目可以在http://code.google.com/p/tesseract-ocr/downloads/list下载。 在使用时,建议使用3而不要使用2,因为一些原因,2虽然可以直接用在工程,但是由于一些显而易见的BUG和其他原因,多导致程序无法运行 ...
分类:
其他好文 时间:
2016-06-13 23:21:58
阅读次数:
1000
一、pytesseract介绍 1、pytesseract说明 pytesseract最新版本0.1.6,网址:https://pypi.python.org/pypi/pytesseract Python-tesseract is a wrapper for google's Tesseract- ...
分类:
编程语言 时间:
2016-06-05 12:37:08
阅读次数:
975
1、背景 前文已经简要介绍tesseract ocr引擎的安装及基本使用,其中提到使用-l eng参数来限定语言库,可以提高识别准确率及识别效率。 本文将针对某个网站的验证码进行样本训练,形成自己的语言库,来提高验证码识别率。 2、准备工具 tesseract样本训练有一个官方流程说明,https: ...
分类:
其他好文 时间:
2016-06-03 19:07:33
阅读次数:
909
1、Tesseract介绍 tesseract 是一个google支持的开源ocr项目,其项目地址:https://github.com/tesseract-ocr/tesseract,目前最新的源码可以在这里下载。 实际使用tesseract ocr也有两种方式:1- 动态库方式 libtesse ...
分类:
编程语言 时间:
2016-06-03 09:50:33
阅读次数:
323
想要在VS中使用Tesseract库,必须使用经过相对应的VS版本编译过的dll以及lib。比如在VS 2013中,就必须使用在VS 2013中编译过的Tesseract库。 这里我给出经过VS 2013编译的Tesseract库, 下载地址: http://pan.baidu.com/s/1o7J ...
分类:
Windows程序 时间:
2016-05-31 20:35:19
阅读次数:
3080
最近接触OCR,先收集一些资料,包括成熟软件、SDK、流行算法。 1. 一个对现有OCR软件及SDK的总结,比较全面,包括支持平台、编程语言、支持字体语言、输出格式、相关链接等 http://en.wikipedia.org/wiki/List_of_optical_character_recogn ...
分类:
其他好文 时间:
2016-05-18 00:26:09
阅读次数:
187
There are a variety of reasons you might not get good quality output from Tesseract. It's important to note that unless you're using a very unusual fo ...
分类:
其他好文 时间:
2016-05-18 00:02:54
阅读次数:
395
一、准备工作与代码实例 1、PIL、pytesser、tesseract (1)安装PIL:下载地址:http://www.pythonware.com/products/pil/(CSDN下载) 下载后是一个exe,直接双击安装,它会自动安装到C:\Python27\Lib\site-packag ...
分类:
编程语言 时间:
2016-05-16 12:54:35
阅读次数:
196
软件: jTessBoxEditor Version 0.9 (30 April 2013) Tesseract-OCR win32 v3.02 with Leptonica 训练步骤: 1.使用jTessBoxEditor,tools->merge_tif,产生tif文件 2.产生box文件 te ...
分类:
其他好文 时间:
2016-05-15 16:37:14
阅读次数:
396
在实际使用 tesseract-orc 识别库的时候,初次制作的识别库很有可能识别率不太理想,需要后期慢慢补充 本文演示如何将多个修正过的box文件合并成一个识别库。 首先,需要图片样本.tif文件,位置文件.box ,只要有这两个文件在,就可以合并字典 假设已存在如下样品图片和修正过的box文件: ...
分类:
其他好文 时间:
2016-05-15 02:14:02
阅读次数:
151