码迷,mamicode.com
首页 > Web开发 > 详细

http复习

时间:2018-06-11 20:30:36      阅读:201      评论:0      收藏:0      [点我收藏+]

标签:头部   爬虫   实现   指示   html   连接   blog   cookie   登陆   

转海峰老师博客

http://www.cnblogs.com/linhaifeng/articles/8243379.html

 

  1. 爬虫最常用的三个头部字段

User_Agent::用户代理

Cookie:之前的登陆信息,凭证

Referer:从哪跳转来的

 

  1. HTTP中最基本的四个方法GET, POST, PUT, DELETE对应着对一个资源的查,改,增,删四个操作

 

  1. 状态码:由三位数字组成,第一个数字定义了响应的类别,共分五种类别:

1xx:指示信息--表示请求已接收,继续处理

2xx:成功--表示请求已被成功接收、理解、接受; 200成功

3xx:重定向--要完成请求必须进行更进一步的操作

4xx:客户端错误--请求有语法错误或请求无法实现

5xx:服务器端错误--服务器未能实现合法的请求

 

  1. 无连接

HTTP无连接说的是:当某个客户机在短时间多次次请求同一个资源,服务器并不能区别是否已经响应过用户的请求。

针对http无连接,人们设计了非持久连接和持久连接(长连接)

 

  1. 无状态:http是无状态协议,是说http协议没法保存客户机信息

优点:在服务器不需要先前信息时它的应答就较快。

缺点:缺少状态意味着如果后续处理需要前面的信息,则它必须重传。这样可能导致每次连接传送的数据量增大

关于http无状态阻碍了交互式应用程序的实现。比如记录用户浏览哪些网页、判断用户是否拥有权限访问等。于是,两种用于保持HTTP状态的技术就应运而生了,一个是Cookie,而另一个则是Session

http复习

标签:头部   爬虫   实现   指示   html   连接   blog   cookie   登陆   

原文地址:https://www.cnblogs.com/yangli0504/p/9168838.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!