目录 一、爬一个简单的网站 二、模拟登录新浪 三、各种请求的发送 四、使用curl 五、模拟登录QQ空间 六、selenium的使用 七、phantomjs的使用 八、开源框架webmagic 九、开源框架scrapy 十、多线程爬取与反爬策略 十一、加密与解密 十二、APP数据抓取 十三、分布式爬 ...
分类:
Web程序 时间:
2018-01-19 11:28:42
阅读次数:
172
前戏 去重且按原来的位置排序 Django的View(视图) 它接受的参数,第一个参数默认就是request对象,它的返回值一定要是一个HttpResponse类型。 说到底就是接收请求,返回响应。 一个视图函数(类),简称视图,是一个简单的Python 函数(类),它接受Web请求并且返回Web响 ...
分类:
其他好文 时间:
2018-01-19 11:27:16
阅读次数:
99
不多说,直接上干货! Fiddler是一个http协议调试代理工具,它能够记录客户端和服务器之间的所有 HTTP请求,可以针对特定的HTTP请求,分析请求数据、设置断点、调试web应用、修改请求的数据,甚至可以修改服务器返回的数据,功能非常强大,是web调试的利器。 下载安装 fiddler官网:h ...
分类:
Web程序 时间:
2018-01-19 11:27:07
阅读次数:
268
一句话就能解释清楚。 MIME标注HTTP响应类型。 而后缀名标注文件类型。 分割线 http响应实质上只有数据,没有文件名。 举个例子吧。 HTTP/1.1 200 OK Server: Apache Date: Thu, 16 Jan 2014 00:41:21 GMT Content-Type ...
分类:
其他好文 时间:
2018-01-19 00:16:11
阅读次数:
135
【转自】http://www.cnblogs.com/findyou/p/5388853.html 目录 3.1 HTTP接口(GET)测试实例 3.1.1 待测接口说明 3.1.2 新建JAVA工程 1.工程目录说明 2.Common.java源码 3.getCityWeathe.java源码 4 ...
分类:
移动开发 时间:
2018-01-19 00:12:56
阅读次数:
202
这两天正好休息下,吧之前学的东西整理了一下, 关于node.js的话,简单的来说,是一种服务端的js编程,如果你是最初来学node的话,看到node.js你会以为是一个js文件,会觉得就像jquery.js一样,直接在html页面引用js文件就可以了,然而事实不是这样,node一种服务端的一个平台, ...
分类:
其他好文 时间:
2018-01-18 23:11:38
阅读次数:
190
. http 协议 http 协议是基于 tcp/ip 协议的。属于应用层协议。 用来实现 客服端向服务器发送请求,服务器返回文件给客户端。 http 协议是基于 tcp/ip 协议的。属于应用层协议。 用来实现 客服端向服务器发送请求,服务器返回文件给客户端。 URL(统一定位资源符): http ...
分类:
Web程序 时间:
2018-01-18 23:11:22
阅读次数:
266
Session机制: 1)、session机制采用的是在服务器端保持 HTTP 状态信息的方案 。 2)、当程序需要为某个客户端的请求创建一个session时,服务器首先检查这个客户端的请求里是否包含了一个session标识(即sessionId),如果已经包含一个sessionId则说明以前已经为 ...
分类:
编程语言 时间:
2018-01-18 23:10:35
阅读次数:
278
比如一个接口,既想实现请求参数是application/json,又想实现form提交,改怎么做呢?用postman不可能做到两全其美。我有一个方法,就是不用requestbody,也可以实现json解析,首先是新建一个包装类,这个类可以重复读inputstream里面的东西。如果加了request ...
分类:
编程语言 时间:
2018-01-18 23:07:39
阅读次数:
517
Filter过滤器作用:在每次请求服务资源时做过滤处理。 原理:Filter接口中有一个doFilter方法,当开发人员编写好Filter类实现doFilter方法,并配置对哪个web资源进行拦截后,WEB服务器每次在调用web资源的service方法之前(服务器内部对资源的访问机制决定的),都会先 ...
分类:
其他好文 时间:
2018-01-18 23:05:58
阅读次数:
160