话不多说,都在代码里 #下载斗鱼颜值栏目主播照片 #author:ives #date:2016-8-28 21:58 #e-mail:renhanlinbsl@163.com import urllib.request import string import re import json imp ...
分类:
编程语言 时间:
2016-08-30 22:30:21
阅读次数:
182
相信最开始接触Python爬虫学习的同学最初大多使用的是urllib,urllib2。在那之后接触到了第三方库requests,requests完全能满足各种http功能,真的是好用爆了 :D 他们是这样说的: “Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用。 ...
分类:
编程语言 时间:
2016-08-27 12:38:53
阅读次数:
239
刚从python3下载图片的语句python2的不太一样,具体python3语句如下: form urllib import request jpg_link = '......' #图片链接 request.urlretrieve(jpg_link, path) # path为路径加名字哦(如 ~ ...
分类:
编程语言 时间:
2016-08-26 15:29:55
阅读次数:
191
1、使用工具:
Python3.5
BeautifulSoup
2、抓取网站:
csdn热门文章列表 http://blog.csdn.net/hot.html
3、实现代码:__author__ = 'Administrator'
import urllib.request
import re
from bs4 import BeautifulSoup
#################...
分类:
编程语言 时间:
2016-08-23 19:07:11
阅读次数:
169
1、使用工具:
Python3.5
BeautifulSoup
2、抓取网站:
csdn首页文章列表 http://blog.csdn.net/
3、实现代码:__author__ = 'Administrator'
import urllib.request
import re
from bs4 import BeautifulSoup
#####################...
分类:
编程语言 时间:
2016-08-23 19:06:22
阅读次数:
181
【urllib.request】 1、urlopen结果保存在内存。 2、ulrretrieve结果保存到文件。 3、response有read方法。 4、可以创建Request对象。 5、发送Post数据,需要encode()成ascii的byte. 6、url中加入query 7、加入User- ...
分类:
Web程序 时间:
2016-08-22 22:58:18
阅读次数:
503
第一:Python爬虫学习系列教程(来源于某博主:http://cuiqingcai.com/1052.html) Python版本:2.7 整体目录: 一、爬虫入门 1. Python爬虫入门一之综述 2. Python爬虫入门二之爬虫基础了解 3. Python爬虫入门三之Urllib库的基本使 ...
分类:
编程语言 时间:
2016-08-21 18:29:51
阅读次数:
276
1.urlopen()方法urllib.urlopen(url[, data[, proxies]]) :创建一个表示远程url的类文件对象,然后像本地文件一样操作这个类文件对象来获取远程数据。参数url表示远程数据的路径,一般是网址;参数data表示以post方式提交到url的数据(玩过web的人 ...
分类:
编程语言 时间:
2016-08-18 23:13:17
阅读次数:
228
最近在进行网络爬虫时,被中文的编码问题搞得很头疼,特别是在windows环境下。 1.爬取到的中文网页内容,在解析时出现解析错误 一般情况下,我们都是用urllib中的相关函数,进行web页面的爬取,然后进行相关处理。 但是经常在处理中文web时,对文本内容的处理,经常出现一些编码错误。 为了彻底解 ...
分类:
编程语言 时间:
2016-08-18 19:36:55
阅读次数:
144
相比httplib、urllib,request真是太美丽了,记录下 get请求: 返回值: ...
分类:
编程语言 时间:
2016-08-18 19:35:55
阅读次数:
126