码迷,mamicode.com
首页 >  
搜索关键字:urlopen    ( 699个结果
函数+装饰器+迭代器+生成器
闭包函数 闭包:定义在内网函数,包含对外部作用域而非全局作用域 范围:一个函数套用1或n个函数 from urllib.request import urlopen #urlopen模块 作用:爬网页 #闭包函数,内部get函数调用外部page函数 def page(url): #调用url def ...
分类:其他好文   时间:2017-05-29 09:53:38    阅读次数:237
爬虫问题
1.urlopen参数设置 urlopen(url, data, timeout) import urllib import urllib2 url = 'http://www.server.com/login' user_agent = 'Mozilla/4.0 (compatible; MSIE ...
分类:其他好文   时间:2017-05-28 15:26:33    阅读次数:189
Http协议 压缩
最近测试代理服务器时,意外的发现使用urlopen请求百度首页时,会返回两种结果,一种是正常的百度首页html源码(以下简称正常结果),一种是'乱码'。样例如下: \x1f\x8b\x08\x00\x00\x00\x00\x00\x00\x03\x8dVKo\xe36\x10\xfe+*\x8d\x ...
分类:Web程序   时间:2017-05-26 19:39:42    阅读次数:1418
python模块整理
一、time模块:import time 1、time.sleep(3) #单位为妙 二、urllib 1、传递一个url地址得到其html内容:from urllib.request import urlopen ...
分类:编程语言   时间:2017-05-25 00:03:27    阅读次数:177
python3 urllib.requesturlopen 一个https 时ssl证书错误!
不知道从那个版本起,python用urlopen打开一个https时会验证一次 SSL 证书,当目标使用的是自签名的证书时就会爆出一个 <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c: ...
分类:编程语言   时间:2017-05-22 15:15:02    阅读次数:180
python爬虫入门(1)-urllib模块
作用:用于读取来自网上(服务器上)的数据基本方法:urllib.request.urlopen(url,data=None,[]timeout]*,cafile=None,cadefault=False,context=None)url:需要打开的网址data:Post提交的数据timeout:设置... ...
分类:编程语言   时间:2017-05-21 23:26:32    阅读次数:343
常用正则表达式爬取网页信息及HTML分析总结
Python爬取网页信息时,经常使用的正则表达式及方法。 1). 获取<tr></tr>标签之间内容开始标签如:<tr>、<th>、<td>、<a>、<table>、<div>...后缀标签如:</tr>、</th>、</td>、</a>、</table>、</div>... 核心代码: # eg_ ...
分类:Web程序   时间:2017-05-20 15:28:00    阅读次数:315
Python简单网页爬虫
由于Python2.x与Python3.x存在很的差异,Python2.x调用urllib用指令urllib.urlopen(), 运行时报错:AttributeError: module 'urllib' has no attribute 'urlopen' 原因是在Python3.X中应该用ur ...
分类:编程语言   时间:2017-05-20 14:24:26    阅读次数:189
Python urllib2 发送HTTP Request
urllib2 是Python自带的标准模块, 用来发送HTTP Request的。 类似于 .NET中的, HttpWebRequest类 urllib2 的优点 Python urllib2 发出的HTTP Request, 能自动被Fiddler截获, 方便了调试。 Python 可以自动处理 ...
分类:编程语言   时间:2017-05-13 19:12:15    阅读次数:133
python常用模块
urllib 1. urllib.urlopen() 打开网页 urlopen返回对象,支持操作: read() readline() readlines() fileno() close() 这些方法的使用方式与文件对象完全一致 info() 返回一个httplib.HTTPMessage对象,表 ...
分类:编程语言   时间:2017-05-13 12:33:33    阅读次数:217
699条   上一页 1 ... 38 39 40 41 42 ... 70 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!