码迷,mamicode.com
首页 > Web开发 > 详细

网站爬取-案例四:知乎抓取(COOKIE登录抓取个人中心)(第二卷)

时间:2018-02-18 12:37:30      阅读:1078      评论:0      收藏:0      [点我收藏+]

标签:post   ssi   防止   存储   用户   div   nbsp   本地   gpo   

接着上卷来分析,作为开发人员我们都知道,登录是一个想指定URL发送POST请求的过程,所以我们需要找到请求的URL,以及字段,先用一个错误账号和密码做一下尝试,如果是正确的话会直接跳转到别的页面,这样COOKIE就会刷新

技术分享图片

很明显拿到了URL看的出来这是手机号的方式进行登录,看下数据

技术分享图片

_xsrf保证请求得安全性防止攻击

再用EMAIL试一下

技术分享图片看下参数

技术分享图片

效果相似

这样请求的URL以及字段都找到了

现在我们需要判断请求类型,先通过源码找一下_xsrf

技术分享图片

现在我们开始编译

技术分享图片兼容写法引入COOKLELIB

 

 技术分享图片登陆请求

技术分享图片获取_xsrf

技术分享图片正则获取

技术分享图片看下结果

技术分享图片这次可以请求,但是这里需要做个登陆,我们这里用下REQUESTS里的SESSION,加大效率

技术分享图片这样不用一次次请求了

技术分享图片全部换掉

技术分享图片调用方法用于存储

技术分享图片

技术分享图片

保存到本地,以后就可以使用了

 技术分享图片加一步异常处理

 

技术分享图片读写下页面

技术分享图片获取了页面

技术分享图片再加一步邮箱验证

最后一步加一步判断用户是否登陆

技术分享图片

 

网站爬取-案例四:知乎抓取(COOKIE登录抓取个人中心)(第二卷)

标签:post   ssi   防止   存储   用户   div   nbsp   本地   gpo   

原文地址:https://www.cnblogs.com/woshiruge/p/8452647.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!