码迷,mamicode.com
首页 > 其他好文 > 详细

大数据分析01——数据爬取

时间:2020-03-22 22:33:56      阅读:79      评论:0      收藏:0      [点我收藏+]

标签:连接   exce   out   for   大数据   odi   style   ppa   request   

2020.3.22

pycharm:使用python进行爬取,并存储到文件

1.爬取网页的通用代码框架

1 try:
2     r = requests.get(url, timeout = 30)
3     r.raise_for_status()
4     r.encoding = r.apparent_encoding
5     return r.text
6 except:
7     return "产生异常"

养成编写爬虫用try-except的方式来保证网络连接异常能被有效处理的习惯。

2.

大数据分析01——数据爬取

标签:连接   exce   out   for   大数据   odi   style   ppa   request   

原文地址:https://www.cnblogs.com/zhangzhongkun/p/12548862.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!