众所周知,很多网站都设置了登录之后才能获取查看页面的权利,因此模拟登录成了爬取信息的第一步,这一步成功了,嘿嘿,just do it!
好,废话不多说,直接说重点:
首先,你应该要了解网站登录的流程以及你需要post的信息,以豆瓣为例:
这就是你需要提交的信息了,包括用户名和密码,以及验证码和验证码的ID,看到这可能有人会想我怎么知道验证码的ID,各位放心,在页面加载时就已经到客户端这边来了,也就是说你可以直接从浏览器中看到,是不是很炫酷!
第二步,需要了解一些requests这个库了,因为reque...
分类:
编程语言 时间:
2015-08-03 14:42:55
阅读次数:
183
如图所示 水区被占领
现在很多网站也经历过被 注册机,发贴机,乱炸,是很可恨的事.但是您想想,为什么注册机,发贴机会这么轻易就可以注册和发贴呢?这是为什么,其实很简单,注册中的验证码 过于简单,等因素。 请看 http://passport.csdn.net/ajax/verifyhandler.ashx
这就是注册的验证码,能不能加点难度呢?请你们看看这个验证码
(注:这是一个某程序...
分类:
其他好文 时间:
2015-08-01 22:07:56
阅读次数:
135
现在已经有很多网站采用汉字作为验证码,其实并不难,之前我们需要了解怎么做字符验证码以及图片验证码
步骤和字符验证码一样,唯一不同在产生随机字串,汉字需要utf8编码,而且要事先准备汉字库,要知道怎么抓取中文字符
我这里就不多说了,上代码:
<?php
session_start();
$width = 200;
$length = 60;
$image = imag...
分类:
Web程序 时间:
2015-07-29 19:24:25
阅读次数:
146
很多站长使用虚拟主机来做网站,网页内容一旦很多,网站打开速度就会特别慢,如果说服务器、带宽、CDN这类硬指标我们没有经济实力去做,不妨通过网页代码优化的方式来提高速度,卢松松总结了一些可行性的方法。1: 缩小Javascript和CSS文件如果你的网站大约有50-60%的用户是第一次访客,那么这些人...
分类:
Web程序 时间:
2015-07-27 10:38:57
阅读次数:
116
css有不少常用的效果,你在平时浏览网站的时候可能会看到,但是真的要自己写的时候,有时候会突然忘记,今天稍微对那些常见的效果做一下小结。1、每逢大的灾难的时候,很多网站变成了灰色,如何让网站快速变灰?css代码是很简单的,用的是css的filter功能。代码如下:html { filter: g.....
分类:
Web程序 时间:
2015-07-26 23:55:56
阅读次数:
309
在说cookie之前,先来看两个例子。 例子 1:如果经常上网,会发现很多网站都有一个功能,下次自动登录,或者一个月内免登录,只要我们不点击“退出”按钮,一段时间后再回到该网站,发现依然在线。这个功能很实用...
分类:
编程语言 时间:
2015-07-23 17:58:29
阅读次数:
148
CSS如何实现把鼠标放在行上整行变色:在很多网站都有这样的效果,那就是当鼠标放在一个文章列表行的时候,此行就会显示与其他行不同的颜色,本站的文章列表也具有这样的效果,便于浏览者识别,非常人性化,下面就简单介绍一下如何实现此效果。代码实例如下:蚂蚁部落 html div+css javascri...
分类:
其他好文 时间:
2015-07-21 14:26:57
阅读次数:
98
动态网站通常利用背景图像或预加载屏幕,以保证所有资源都加载到页面上,在浏览器中充分呈现。现在很多网站都炫耀自己的图像作为背景图像全屏背景,追溯到旧的Flash网站却用自己的方式在HTML资源重布局。
分类:
Web程序 时间:
2015-07-15 13:11:50
阅读次数:
150
什么是pjax?现在很多网站(facebook,twitter)都支持这样的一种浏览方式, 当你点击一个站内的链接的时候, 不是做页面跳转, 而是只是站内页面刷新。 这样的用户体验, 比起整个页面都闪一下来说, 好很多。 其中有一个很重要的组成部分, 这些网站的ajax刷新是支持浏览器历史的, 刷新...
分类:
其他好文 时间:
2015-07-15 10:51:37
阅读次数:
198