码迷,mamicode.com
首页 > 其他好文 > 详细

小总结1

时间:2019-07-02 13:29:36      阅读:92      评论:0      收藏:0      [点我收藏+]

标签:ssi   发送请求   get   二进制流   github   hub   orm   写入   user   

一、爬虫基本原理
-爬虫全过程
1.发送请求
2.接收响应数据
3.解析并提取有价值的数据
4.保存数据

二、Requests请求库
-get
url
headers
cookies
- post
url
headers
cookies
data

三、爬取校花网视频
1.通过主页解析提取详情页
2.通过详情页提取视频url
3.获取视频的二进制流写入本地

四、自动登录github
1.分析请求头与请求体信息
-用户名
-密码
-token
-杂七杂八

2.token
-通过对log in页面的解析提取

3.对session_ url发送请求
- headers:
-user-agent

- cookies:
-login页面的cookies

-data:
-form_ data

小总结1

标签:ssi   发送请求   get   二进制流   github   hub   orm   写入   user   

原文地址:https://www.cnblogs.com/Auraro997/p/11120032.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!