1 package cn.itcast.img; 2 import java.awt.BasicStroke; 3 import java.awt.Color; 4 import java.awt.Font; 5 import java.awt.Graphics2D; 6 import java.a ...
分类:
编程语言 时间:
2020-01-12 20:06:04
阅读次数:
106
#效果不是很好 加上灰度处理和二值化处理 就变好了 import pytesseract from PIL import Image from PIL import ImageEnhance #打开图片 img = Image.open('f7vf.png') #提高辨识度 img = img.co ...
分类:
其他好文 时间:
2020-01-12 18:20:06
阅读次数:
75
``` import time from selenium import webdriver from aip import AipOcr def initial(): """ 初始化连接 """ APP_ID = '16611607' API_KEY = 'wAIXfXOUS8ztLa4FrK3r... ...
# 图形验证码: - 作用:注册页面 - 实现思路: - 生成4位字符串--产生随机数 - 绘制图片--python的PIL包,但这里我不用它,我用第三包captcha来绘制 - 响应,--告诉浏览器--指定数据类型为image/png - pip install Pillow - 解压拷贝capc ...
分类:
其他好文 时间:
2020-01-10 12:52:49
阅读次数:
140
爬虫学习 07.验证码处理 引入 相关的门户网站在进行登录的时候,如果用户连续登录的次数超过3次或者5次的时候,就会在登录页中动态生成验证码。通过验证码达到分流和反爬的效果。 今日概要 使用云打码平台识别验证码 知识点回顾 session的创建方式 session的作用 proxies参数的作用 高 ...
分类:
其他好文 时间:
2020-01-09 23:01:09
阅读次数:
111
爬虫学习 08.Python网络爬虫之图片懒加载技术、selenium和PhantomJS 引入 今日概要 图片懒加载 selenium phantomJs 谷歌无头浏览器 知识点回顾 验证码处理流程 今日详情 动态数据加载处理 一.图片懒加载 什么是图片懒加载? 案例分析:抓取站长素材http:/ ...
分类:
编程语言 时间:
2020-01-09 22:24:11
阅读次数:
113
原理 核心思想:相似的输入必会产生相似的输出。 原理:首先从训练样本矩阵中选择第一个特征进行划分,使每个子表中该特征的值全部相同(比如第一个特征是男女,则可以划分出两个子表,男表和女表),然后再在每个子表中选择下一个特征按照同样的规则继续划分更小的子表(比如第二个特征是年龄,我可以划分成三个子表(当 ...
分类:
其他好文 时间:
2020-01-09 13:20:52
阅读次数:
158
[toc] git团队开发 git协同开发: git 版本冲突: ...
分类:
其他好文 时间:
2020-01-08 22:43:46
阅读次数:
77
1. 获取cookies 实现代码如下: import time from selenium import webdriver class cookies_login: wd=webdriver.Chrome() def getCookies(self): wd=self.wd wd.maximiz ...
分类:
编程语言 时间:
2020-01-08 21:07:21
阅读次数:
77