当url地址含有中文,或者参数有中文的时候,这个算是很难正常了,但是把这样的url作为参数传递的时候(最常见的callback),需要把一些中文甚至‘/’做一下编码转换。 一、urlencode urllib库里面有个urlencode函数,可以把key-value这样的键值对转换成我们想要的格式, ...
分类:
编程语言 时间:
2016-09-19 19:24:26
阅读次数:
150
上篇文章已经介绍了抓取糗事百科的段子,这篇文章来抓取百度贴吧帖子内容,涉及到urllib,urllib2,re等模块。 代码实现功能: 1.获取某一个帖子的标题 2.获取帖子回复的所有页数,以及每一页的内容 3.可以只获取楼主的回复(使用数字1声明),或者所有回复(使用数字0声明) 直接使用oop编 ...
分类:
其他好文 时间:
2016-09-13 20:33:34
阅读次数:
201
安装的版本是sublime text3 使用package control组件在线安装 点击view——>show control 出现以下界面:(我的是已经安装过的) 然后将下面一段代码复制粘贴到控制台(亲测有效),回车, import urllib.request,os; pf = 'Packa ...
分类:
其他好文 时间:
2016-09-12 20:24:13
阅读次数:
106
requests是python的一个HTTP客户端库,跟urllib,urllib2类似,那为什么要用requests而不用urllib2呢?官方文档中是这样说明的: python的标准库urllib2提供了大部分需要的HTTP功能,但是API太逆天了,一个简单的功能就需要一大堆代码。 我也看了下r... ...
分类:
编程语言 时间:
2016-09-12 12:14:01
阅读次数:
263
最近网上面试看到了有关这方面的问题,由于近两个月这些库或多或少都用过,现在根据自己的经验和网上介绍来总结一下。 httplib 实现了HTTP和HTTPS的客户端协议,一般不直接使用,在python更高层的封装模块中(urllib,urllib2)使用了它的http实现。所以效率要比这两个库高一点。 ...
分类:
Web程序 时间:
2016-09-11 12:46:41
阅读次数:
217
来源:http://www.jb51.net/article/42630.htm urllib模块 urlretrieve方法 urllib.urlretrieve(url[, filename[, reporthook[, data]]])参数说明:url:外部或者本地urlfilename:指定 ...
分类:
编程语言 时间:
2016-09-10 22:09:36
阅读次数:
160
报错:import urllib.request ImportError: No module named request 解决办法; 原因查询源码 (python3.5.2) ,urllib moudle中并没有request相关方法,直接是urlopen方法 ...
分类:
编程语言 时间:
2016-09-10 19:09:11
阅读次数:
1569
Urllib2 相当于的Urllib 的升级版 但又不能代替 Urllib 这个我得新手很费解呢...这个问题留着把,,等以后成大牛的时候在回来想想这儿问题!! Urllib2 常用 // 1 设置超时 #设置请求头 设置Cookie 创建 一个cookie 来接受Cookie ...
分类:
Web程序 时间:
2016-09-10 17:33:59
阅读次数:
138
查询城市天气最后一节 需要导入上一节的结果city10.py #!/usr/bin/python# -*- coding: UTF-8 -*-import urllib.requestfrom city10 import city #从city10.py里导入city变量名称import json ...
分类:
编程语言 时间:
2016-09-10 16:02:04
阅读次数:
127
其中用 用urllib.request 中的urlopen打开百度(一定要加http,用read方法读取html代码,用 utf—8 解码。 其中,response对象有一个getcode()方法,可以得到HTTP状态码(200为成功 其中baidu能够正常访问,google访问超时,其中传入的三个 ...
分类:
编程语言 时间:
2016-09-09 14:55:08
阅读次数:
145