爬取网页的通用代码框架
| 异常 | 说明 | 
| requests.ConnectionError | 网络连接错误异常,比如DNS查询失败、拒绝连接等 | 
| requests.HTTPError | HTTP错误异常 | 
| requests.URLRequired | URL缺失异常 | 
| requests.TooManyRedirects | 超过最大重定向次数,产生重定向异常 | 
| requests.ConnectTimeout | 连接远程服务器超时异常 | 
| requests.Timesout | 请求URL超时,产生超时异常 | 
理解requests库的异常:
| r.raise_for_status() | 如果不是200,产生异常requests.HTTPError | 
示例:
import requests def getHTMLText(url): try: r=requests.get(url,timeout=30) r.raise_for_status()#如果状态不是200,引发HTTPError异常 r.encoding=r.apparent_encoding return r.text except: return ‘产生异常‘
结果:

