码迷,mamicode.com
首页 > Web开发 > 详细

urllib库基本使用

时间:2018-04-14 18:06:10      阅读:267      评论:0      收藏:0      [点我收藏+]

标签:clean   import   com   网页缓存   下载   读取   val   code   访问   

#导入urllib库
import urllib.request
#打开网址
file=urllib.request.urlopen("http://www.sohu.com/",timeout=5)
#读取网页源码
file.read().decode("utf-8","ignor")
#返回爬取网页的状态码
print(file.getcode())
#获取当前访问网页的url
print(file.geturl())
#清除网页缓存
urllib.request.urlcleanup()
#直接下载网页到本地,在下载图片、音频等时候使用
# urllib.request.urlretrieve("网址","本地文件存储路径+文件名")
urllib.request.urlretrieve("http://audio.xmcdn.com/group6/M05/A8/FF/wKgDg1dsApazZL0ZAKval9KT2Hc966.m4a","I:/?555555555555")
#网址拼接时,需转码
‘‘‘
如果在构造网址时需要将中文拼接进去时,最好转下码再拼接
‘‘‘
keywd="汪峰"
keywd=urllib.request.quote(keywd)
url="http://www.baidu.com/s?wd="+keywd

 

urllib库基本使用

标签:clean   import   com   网页缓存   下载   读取   val   code   访问   

原文地址:https://www.cnblogs.com/xshan/p/8832971.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!