1.背景 urllib,urllib2是客户端http协议的实现,urllib2底层使用httplib,socket库,它主要包含urlopen, build_opener, install_opener等func。python2.7使用urllib2库中的urlopen会出现内存泄漏的现象,可以通 ...
分类:
Web程序 时间:
2019-01-13 22:22:41
阅读次数:
317
import re import urllib.request def getHtml(url): page=urllib.request.urlopen(url) html=page.read() return html def getImg(html): reg = r'src="([.*\S]... ...
分类:
其他好文 时间:
2019-01-12 00:16:51
阅读次数:
491
首先,python 3.x中urllib库和urilib2库合并成了urllib库。 其中urllib2.urlopen()变成了urllib.request.urlopen() urllib2.Request()变成了urllib.request.Request() import urllib.r ...
分类:
编程语言 时间:
2019-01-10 13:13:33
阅读次数:
120
1from urllib.robotparser import RobotFileParser 2import ssl 3from urllib.request import urlopen 4ssl._create_defaul ...
分类:
Web程序 时间:
2019-01-07 01:43:00
阅读次数:
154
对于互联网数据,Python 有很多处理网络协议的工具,urllib 是很常用的一种。 一、urllib.request,request 可以很方便的抓取 URL 内容。 urllib.request.urlopen(url) 返回请求 url 后的二进制对象· 参数:url=‘http://www ...
分类:
编程语言 时间:
2019-01-02 15:07:41
阅读次数:
290
# re的工作是在python中执行正则表达式 import re # # find # result = re.findall("\d+", "baby的电话号是: 185123456789") # print(result) # # it = re.finditer("\d+", "baby12... ...
分类:
其他好文 时间:
2018-12-28 21:14:28
阅读次数:
210
1,请求:requests requests.get(url, headers) requests.post(url, data=data, files=files) urllib模块: Python2 import urllib2 response = urllib2.urlopen('http: ...
分类:
编程语言 时间:
2018-12-28 12:03:29
阅读次数:
177
1、使用urllib模块(使用不方便,建议使用第二种) get请求: res = urlopen(url) post请求: 注意:带参数的时候是一个post请求,若http://127.0.0.1:8999/api/login接口的方法限定了methods为get,则会报错urllib.error. ...
分类:
编程语言 时间:
2018-12-27 18:49:31
阅读次数:
329
import re import os import urllib #根据给定的网址来获取网页详细信息,得到的html就是网页的源代码 def getHtml(url): page = urllib.request.urlopen(url) html = page.read() return htm... ...
分类:
编程语言 时间:
2018-12-27 11:21:35
阅读次数:
180
1、使用urllib模块 get请求: res = urlopen(url) post请求: 注意:带参数的时候是一个post请求,若http://127.0.0.1:8999/api/login接口的方法限定了methods为get,则会报错urllib.error.HTTPError: HTTP ...
分类:
编程语言 时间:
2018-12-26 12:56:02
阅读次数:
216