网页cookie的使用 Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密) # opener的概念当你获取一个URL你使用一个opener(一个urllib2.OpenerDirector的实例)。在前面,我们都是使用的默认的opener,也 ...
分类:
编程语言 时间:
2017-05-16 21:35:20
阅读次数:
224
-*- coding: utf-8 -*- import urllib2 import os def mean_audience_score(id): arv = 0.0 sc_url = "http://movie.mtime.com/" + id + "/" sc_req = urllib2.R... ...
分类:
编程语言 时间:
2017-05-15 19:47:28
阅读次数:
632
urllib2 是Python自带的标准模块, 用来发送HTTP Request的。 类似于 .NET中的, HttpWebRequest类 urllib2 的优点 Python urllib2 发出的HTTP Request, 能自动被Fiddler截获, 方便了调试。 Python 可以自动处理 ...
分类:
编程语言 时间:
2017-05-13 19:12:15
阅读次数:
133
python3中urllib2被整合成了url.request和url.error了 ...
分类:
Web程序 时间:
2017-05-13 14:22:11
阅读次数:
173
beautifulsoup 获取特定html源码import refrom bs4 import BeautifulSoupimport urllib2url = 'http://www.cnblogs.com/vickey-wu/'# connect to a URLweb = urllib2.u ...
分类:
编程语言 时间:
2017-05-12 01:37:42
阅读次数:
208
Python标准库中提供了:urllib、urllib2、httplib等模块以供Http请求,但是,它的 API 太渣了。它是为另一个时代、另一个互联网所创建的。它需要巨量的工作,甚至包括各种方法覆盖,来完成最简单的任务。 Requests 是使用 Apache2 Licensed 许可证的 基于 ...
分类:
其他好文 时间:
2017-05-10 19:55:26
阅读次数:
284
Python标准库中提供了:urllib、urllib2、httplib等模块以供Http请求,但是,它的 API 太渣了。它是为另一个时代、另一个互联网所创建的。它需要巨量的工作,甚至包括各种方法覆盖,来完成最简单的任务。 Requests 是使用 Apache2 Licensed 许可证的 基于 ...
分类:
编程语言 时间:
2017-05-10 19:50:12
阅读次数:
226
初识爬虫 requests Python标准库中提供了:urllib、urllib2、httplib等模块以供Http请求,但是,它的 API 太渣了。它是为另一个时代、另一个互联网所创建的。它需要巨量的工作,甚至包括各种方法覆盖,来完成最简单的任务。 Requests 是使用 Apache2 Li ...
分类:
其他好文 时间:
2017-05-10 17:03:35
阅读次数:
244
# coding: utf-8 import urllib import urllib2 import re import os if __name__=='__main__': print "抓取开始..." j = 1 for i in range(1,35): url='http://www.... ...
分类:
编程语言 时间:
2017-05-09 21:50:14
阅读次数:
182
url: 就是需要请求,并进行下一步处理的url callback: 指定该请求返回的Response,由那个函数来处理。 method: 一般不需要指定,使用默认GET方法请求即可 headers: 请求时,包含的头文件。一般不需要。内容一般如下:使用 urllib2 自己写过爬虫的肯定知道 Ho... ...
分类:
其他好文 时间:
2017-05-07 18:42:30
阅读次数:
1554