python操作网络,也就是打开一个网站,或者请求一个http接口。 使用requests模块,pip install requests 安装即可。 requests 模块是基于urllib模块进行开发的,urllib用起来比较麻烦:传参数的话,都得是bytes类型,返回数据也是bytes类型,还得 ...
分类:
编程语言 时间:
2017-07-09 12:41:57
阅读次数:
227
可以使用python自带的urllib模块去请求一个网站,或者接口,但是urllib模块太麻烦了,传参数的话,都得是bytes类型,返回数据也是bytes类型,还得解码,想直接把返回结果拿出来使用的话,还得用json,发get请求和post请求,也不通,使用比较麻烦,还有一个比较方便的模块,比url ...
分类:
编程语言 时间:
2017-07-08 16:55:34
阅读次数:
214
下面我们再来看看 urllib 模块提供的 urlretrieve() 函数。urlretrieve() 方法直接将远程数据下载到本地。 1 >>> help(urllib.urlretrieve) 2 Help on function urlretrieve in module urllib: 3 ...
分类:
编程语言 时间:
2017-06-30 17:31:46
阅读次数:
154
urllib模块中的方法 1.urllib.urlopen(url[,data[,proxies]]) 打开一个url的方法,返回一个文件对象,然后可以进行类似文件对象的操作。本例试着打开google urlopen返回对象提供方法: - read() , readline() ,readlines ...
分类:
编程语言 时间:
2017-06-20 21:05:40
阅读次数:
135
作用:用于读取来自网上(服务器上)的数据基本方法:urllib.request.urlopen(url,data=None,[]timeout]*,cafile=None,cadefault=False,context=None)url:需要打开的网址data:Post提交的数据timeout:设置... ...
分类:
编程语言 时间:
2017-05-21 23:26:32
阅读次数:
343
1、vars() 查看一个.py文件中的全局变量 print(vars()) #重点 __name__': '__main__ '__file__': 'C:/Users/lenovo/PycharmProjects/老男孩/pppppppp.py' {'__spec__': None, '__na ...
分类:
Web程序 时间:
2017-05-14 19:40:34
阅读次数:
275
1 定义一个方法get_page(url),url参数是需要获取网页内容的网址,返回网页的内容。提示(可以了解python的urllib模块) 2 import urllib.request 3 4 def get_page(url): 5 response = urllib.request.url... ...
分类:
编程语言 时间:
2017-05-02 23:46:33
阅读次数:
376
上一课我们成功的下载了页面的第一篇文章,这一课我们的目标是怎么把第一页的所有文章都下载下来。还是先继续我们上一节课的内容。 ...
分类:
编程语言 时间:
2017-04-16 17:53:06
阅读次数:
190
因为本人一直对推理悬疑比较感兴趣,所以这次爬取的网站也是平时看一些悬疑故事的网站,同时也是因为这个网站在编码上面和一些大网站的博客不同,并不那么规范,所以对于初学者还是有一定的挑战性的。我打算把这个爬虫分三次讲,所以每次都先完成一个小目标(当然不是一个亿啦),这次课我们先爬取当前页面的并且下载第一篇... ...
分类:
编程语言 时间:
2017-04-14 14:50:10
阅读次数:
251
Django站点使用django_cas接入SSO(单点登录系统),配置完成后登录,抛出“urlopen error unknown url type: https”异常。寻根朔源发现是python内置的urllib模块不支持https协议。 >>> import urllib>>> urllib. ...
分类:
编程语言 时间:
2017-04-09 12:37:04
阅读次数:
214