1.爬虫基础 2.爬虫基础二 XPath语法和lxml模块 3.爬虫基础三 BeautifulSoup4库 4.爬虫基础四 正则表达式 5.爬虫基础五 json文件处理、csv文件处理、MySQL数据库操作 6.爬虫基础六 多线程爬虫 7.爬虫基础七 图形验证码识别技术 8.爬虫基础八Scrapy框 ...
分类:
其他好文 时间:
2018-09-02 20:25:46
阅读次数:
206
ocr图片识别通常可以利用tesserocr模块,将图片中内容识别出来并转换为text并输出 Tesserocr是python的一个OCR识别库,是对tesseract做的一层python APT封装。在安装Tesserocr前,需要先安装tesseract tessrtact文件: https:/ ...
分类:
编程语言 时间:
2018-08-08 16:40:45
阅读次数:
300
TensorFlow 可以用来实现验证码识别的过程,这里识别的验证码是图形验证码,首先用标注好的数据来训练一个模型,然后再用模型来实现这个验证码的识别。 生成验证码 首先生成验证码,这里使用 Python 的 captcha 库来生成即可,这个库默认是没有安装的,所以需要先安装这个库,另外还需要安装 ...
分类:
其他好文 时间:
2018-07-28 13:50:55
阅读次数:
256
先找了一个简单的图形验证码进行测试,比如知网,从网页里把验证码下载到本地 进行简单的灰度处理和二值化处理,能够提高不少识别正确率 验证码: 代码: 结果: 如果没有灰度处理和二值化处理这个9就总识别错了 ...
分类:
其他好文 时间:
2018-07-23 21:12:18
阅读次数:
192
前言 有些登录的接口会有验证码:短信验证码,图形验证码等,这种登录的话验证码参数可以从后台获取的(或者查数据库最直接)。 获取不到也没关系,可以通过添加cookie的方式绕过验证码。 一、抓登录cookie 1.登录后会生成一个已登录状态的cookie,那么只需要直接把这个值添加到cookies里面 ...
分类:
编程语言 时间:
2018-07-23 14:54:19
阅读次数:
138
自己在做项目的时候总结的配置全部流程,用作记录也希望能帮助大家。 一、进行kaptha的依赖配置 二、web.xml配置,我们只需要简单配置一个 Servlet,页面通过 IMG 标签就可以展现图形验证码。 三、扩展 UsernamePasswordTokenShiro 表单认证,页面提交的用户名密 ...
分类:
编程语言 时间:
2018-07-05 18:22:40
阅读次数:
249
可以在utils中新建一个mcaptcha.js 代码如下: module.exports = class Mcaptcha { constructor(options) { this.options = options; this.fontSize = options.height * 3 / 6 ...
分类:
微信 时间:
2018-06-30 18:52:59
阅读次数:
5668
// 点击切换图形验证码 页面加载完后执行,类似window.onload $(function () { var imgCaptcha = $(".img-captcha"); imgCaptcha.click(function () { imgCaptcha.attr("src", "/acco... ...
分类:
其他好文 时间:
2018-06-28 19:23:06
阅读次数:
226
获取验证码图片 识别缺口位置 生成滑块拖动路径 模拟实现滑块拼合 估计是高分屏的原因,截全图下来的时候我用画图软件看了图形验证码的像素位置,刚好是给的位置参数乘以2,所以保存下来的2张验证码的图还要压缩一下分辨率,加入下面语句就可以做对比匹配了。 修改参数 结果输出: ...
分类:
其他好文 时间:
2018-06-18 15:59:28
阅读次数:
522
12.1.图形验证码生成 (1)utils/captcha/init.py (2)在utils/captcha文件下面放几种字体 (3)front/views.py (4)生成验证码 运行项目,浏览器访问:http://127.0.0.1:5000/captcha/,可以看到生成的随机验证码 ...
分类:
其他好文 时间:
2018-06-08 15:49:50
阅读次数:
207