urlencode与urldecode 当url中包含中文或者参数包含中文,需要对中文或者特殊字符(/、&)做编码转换。 urlencode的本质:把字符串转为gbk编码,再把\x替换成%。如果终端是utf8编码的,需要把结果再转成utf8输出,否则会乱码。 urlencode urllib库里面的 ...
分类:
编程语言 时间:
2018-05-29 00:28:44
阅读次数:
158
1 # ''' 2 # Created on 2018-5-26 3 # 4 # @author: yaoshuangqi 5 # ''' 6 import urllib.request 7 import urllib.parse 8 import json 9 10 class YoudaoFan... ...
分类:
编程语言 时间:
2018-05-27 18:03:21
阅读次数:
242
# -*- coding: utf-8 -*- import urllib2,json import urllib import time http_url='https://api-cn.faceplusplus.com/facepp/v3/compare' key = "iMP75CfbxCNQ... ...
分类:
其他好文 时间:
2018-05-27 16:24:53
阅读次数:
161
urilib是python的标准库,当我们使用Python爬取网页数据时,往往用的是urllib模块,通过调用urllib模块的urlopen(url)方法返回网页对象,并使用read()方法获得url的html内容,然后使用BeautifulSoup抓取某个标签内容,结合正则表达式过滤。但是,用u ...
分类:
Web程序 时间:
2018-05-27 16:20:49
阅读次数:
276
写出来的爬虫,肯定不能只在一个页面爬,只要要爬几个页面,甚至一个网站,这时候就需要用到翻页了 其实翻页很简单,还是这个页面http://bbs.fengniao.com/forum/10384633.html,话说我得给这个人增加了多大的访问量啊...... 10384633重点关注下这个数字,这个 ...
分类:
编程语言 时间:
2018-05-27 10:48:44
阅读次数:
199
python 3中urlretrieve方法直接将远程数据下载到本地.为什么不行? 55 import re import urllib.request def getHtml(url): page = urllib.request.urlopen(url) html = page.read() r ...
分类:
编程语言 时间:
2018-05-26 00:02:51
阅读次数:
255
from urllib import parse#url编码url = 'http://www.baidu.com?query = python基础教程'url_str = parse.quote_plus(url) #quote 跟quote_plus一样的,后者更牛逼,把汉字变成url编码pri... ...
分类:
Web程序 时间:
2018-05-25 23:30:07
阅读次数:
271
from urllib import parseurl='http://www.baidu.com?qurey=python基础教程 @@@'# url_str=parse.quote_plus(url) #url编码print(parse.quote_plus(url))from urllib i ...
分类:
其他好文 时间:
2018-05-25 21:07:32
阅读次数:
205
1 import urllib.request 2 import random 3 4 url = "http://www.baidu.com/" 5 6 # 可以是User-Agent列表,也可以是代理列表 7 ua_list = [ 8 "Mozilla/5.0 (Macintosh; Inte... ...
分类:
其他好文 时间:
2018-05-24 21:56:03
阅读次数:
844