import scrapy import urllib.request from scrapy.http import Request,FormRequest class LoginspdSpider(scrapy.Spider): name = "loginspd" allowed_domains... ...
分类:
其他好文 时间:
2017-05-11 16:56:57
阅读次数:
284
/** * 需求:模拟登陆,给3次机会,并给提示还有几次 * 用户名和密码都是 admin * * * * @author flzen * */ public class Demo { public static void main(String[] args) { //提示用户输入账号和密码 Sc... ...
分类:
其他好文 时间:
2017-05-11 11:44:54
阅读次数:
150
最近由于项目的需要,需要做数据抓取,也就是用的curl相关的函数库,在这之前还真心没有接触过这么高大上的东西,然后从刚开始到今天才研究curl算是第四天了,写这篇博客记录一下这几天的一个过程,在使用curl模拟登陆抓取数据过程中需要注意的一些事项,以及介绍一款支持跨平台(windows、linux、 ...
分类:
Web程序 时间:
2017-05-05 19:28:07
阅读次数:
376
之前有了实现模拟登陆coursera的经验,我们可以模仿着来模拟登陆V2EX,因为这个网站的登陆不需要验证码,所以先从这个网站下手。 先打开登陆页面,按F12,用错误的用户名和密码登陆一次。 关键的就是form_data中提交发送的数据。连续试了几次发现用户名和密码是自动生成的会变的每次,所以我们需 ...
分类:
编程语言 时间:
2017-05-01 15:07:31
阅读次数:
188
7-1 爬虫和反爬的对抗过程以及策略 Ⅰ、爬虫和反爬虫基本概念 Ⅱ、反爬虫的目的 Ⅲ、爬虫和反爬虫对抗过程 7-2 scrapy架构源码分析 原理图: 我最早接触scrapy的时候就是看这张原理图,如下图 现在有新的原理图,更加直观,如下图 看了视频讲的源码解析,看一遍根本看不懂,后期还要多看叫上项 ...
分类:
其他好文 时间:
2017-04-25 23:28:48
阅读次数:
726
最近跟同学学习爬虫的时候看到网上有个帖子,好像是山大校园网不稳定,用py做了个模拟登陆很有趣,于是我走上了一条不归路..... 先上一张校园网截图 首先弄清一下模拟登陆的原理: 1:服务器判定浏览器登录使用浏览器标识,需要模拟登陆 2: 需要post账号,密码,以及学校id python走起,我用的 ...
分类:
编程语言 时间:
2017-04-21 23:55:53
阅读次数:
394
模拟登陆:1. 用户输入帐号密码进行登陆2. 用户信息保存在文件内3. 用户密码输入错误三次后锁定用户 代码: ...
分类:
其他好文 时间:
2017-04-20 18:33:08
阅读次数:
170
最近飞信不能用了…zabbix报警无法收到短信…其实搭建的方法很简单,微信官网的API文档也非常详细了.只是之前网上没有找到具体的文档..自己饶了不少弯路..刚开始用微信公众平台试了下..有一个非官网的sdk..可以模拟登陆..但是需要关注的用户48小时内和公众号有过互动…这个显然..
分类:
微信 时间:
2017-04-15 21:11:58
阅读次数:
394
模拟登录的原理都差点儿相同,大致都是这样: 打开首页获取相关cookie。提交登陆表单(即username与password)。确认是否登录成功。 假设想了解更具体的原理与相关知识,推荐到具体解释抓取站点,模拟登陆。抓取动态网页的原理和实现(Python,C#等)。(只是这系列博文实在太绕太绕太绕, ...
分类:
编程语言 时间:
2017-04-15 14:49:49
阅读次数:
144
模拟登录的原理都差点儿相同。大致都是这样: 打开首页获取相关cookie;提交登陆表单(即username与password)。确认是否登录成功。 假设想了解更具体的原理与相关知识,推荐到具体解释抓取站点。模拟登陆,抓取动态网页的原理和实现(Python。C#等)。(只是这系列博文实在太绕太绕太绕。 ...
分类:
编程语言 时间:
2017-04-15 14:49:19
阅读次数:
142