码迷,mamicode.com
首页 > 移动开发 > 详细

Python爬取CSDN专家博客系类——移动开发

时间:2015-08-11 21:31:26      阅读:237      评论:0      收藏:0      [点我收藏+]

标签:爬虫   正则   移动开发   python   

文章分为两部分:爬取移动开发专家的姓名和博客首页地址,爬取每个专家的所有博客存放在已该专家名字命名的txt文件中
说明:本爬虫主要是采用BeautifulSoup和少量的正则匹配,在第一部分抓取完毕后需要将文件格式改为ANSI,代码如下:
第一部分:

第二部分:
结果如下图:
技术分享
技术分享

版权声明:本文为博主原创文章,未经博主允许不得转载。

Python爬取CSDN专家博客系类——移动开发

标签:爬虫   正则   移动开发   python   

原文地址:http://blog.csdn.net/gamer_gyt/article/details/47426509

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!