URLLIB,URLLIB2,PYCURL,HTTPIE,,,在测试PUT及认证时,还是REQUESTS胜出。。测试过程及样例代码如下:import urllib import urllib2 import base64import jsonimport requests#GETurl = 'ht....
分类:
其他好文 时间:
2015-10-18 23:10:31
阅读次数:
267
#!/usr/bin/python#coding:utf-8import timeimport urllibimport urllib2from bs4 import BeautifulSoupimport reimport cookielibdef main0(): unix_timenow...
分类:
编程语言 时间:
2015-10-17 21:54:17
阅读次数:
229
#爬取网站中的图片 1 import re #正则表达式库 2 import urllib #url链接库 3 4 def getHtml(url): 5 page = urllib.urlopen(url) #打开链接 6 html = page.read() ...
分类:
编程语言 时间:
2015-10-16 15:10:12
阅读次数:
278
The urllib and urllib2 ModulesFor simple downloads, urllib is quite all right. If you need HTTP authentication or cookies, or you want to write extens...
分类:
编程语言 时间:
2015-10-16 13:08:23
阅读次数:
130
本实验在Ubuntu14.04上完成。使用的浏览器是火狐(Firefox 33.0),python版本是2.7.6。大家都知道用urllib配合正则表达式抓取静态HTML的内容很方便,但是如果网页中有javascript动态生成的内容,urllib就无能为力了。此时我们要借助一个额外的工具:sele...
分类:
编程语言 时间:
2015-10-14 23:51:30
阅读次数:
443
用python抓取指定页面:代码如下:import urllib.requesturl= "http://www.baidu.com"data = urllib.request.urlopen(url).read()#data = data.decode('UTF-8')print(data)url...
分类:
编程语言 时间:
2015-10-09 00:33:23
阅读次数:
329
Python2.7里内置了很多非常有用的库,它在我电脑上的位置在/usr/lib/python2.7中。写个基本的爬虫要用到的库有urllib、urllib2、cookielib、sgmllib和re,下面先分别简单介绍下一些文件的信息和相关函数——具体的真的是建议阅读源码,网上找的资料反而不及它直...
分类:
编程语言 时间:
2015-10-08 00:27:20
阅读次数:
306
sublime text 3 import?urllib.request,os; pf =?‘Package Control.sublime-package‘; ipp =?sublime.installed_packages_path(); urllib.request.install_opener( urllib.request.build_opener( urllib.reque...
分类:
其他好文 时间:
2015-10-07 01:13:16
阅读次数:
180
requests是python的一个HTTP客户端库,跟urllib,urllib2类似,那为什么要用requests而不用urllib2呢?官方文档中是这样说明的:python的标准库urllib2提供了大部分需要的HTTP功能,但是API太逆天了,一个简单的功能就需要一大堆代码。我也看了下req...
分类:
编程语言 时间:
2015-10-06 22:15:52
阅读次数:
311
仅仅列出我用到的,不全。划重点: 1. urllib2 用 urllib.request 代替 2. urllib.urlencode 用 urllib.parse.urlencode 代替 3. cookielib 用 http.cookiejar 代替 4. print " " 用 pr...
分类:
编程语言 时间:
2015-10-04 18:24:01
阅读次数:
415