urllib2使用header模拟浏览器,在urllib模块里是没有这个功能的importurllib2importsysurl="http://192.168.1.106"f=urllib2.Request(url)f.add_header(‘User-Agent‘,‘Mozilla/5.0(Windows;U;WindowsNT5.1;zh-CN;rv:1.8.1.14)Gecko/20080404(FoxPlus)Firefox/2.0.0.14‘)printur..
分类:
其他好文 时间:
2014-09-07 03:22:24
阅读次数:
189
由于需要从某个网页上下载一些PDF文件,但是需要下载的PDF文件有几百个,所以不可能用人工点击来下载。正好Python有相关的模块,所以写了个程序来进行PDF文件的下载,顺便熟悉了Python的urllib模块和ulrllib2模块。
1、问题描述
需要从http://www.cvpapers.com/cvpr2014.html上下载几百个论文的PDF文件,该网页如下图所示:
2、问...
分类:
编程语言 时间:
2014-07-01 06:58:59
阅读次数:
428
Django站点使用django_cas接入SSO(单点登录系统),配置完成后登录,抛出“urlopen error unknown url type: https”异常。寻根朔源发现是python内置的urllib模块不支持https协议。
>>> import urllib
>>> urllib.urlopen('http://www.baidu.com')
>
>>> url...
分类:
编程语言 时间:
2014-05-07 03:43:55
阅读次数:
424