码迷,mamicode.com
首页 > 编程语言 > 详细

爬虫+python3(网页图片)

时间:2017-04-13 12:53:13      阅读:157      评论:0      收藏:0      [点我收藏+]

标签:代码   question   正则表达式   自己   问题   爬取   bsp   ges   blog   

 

http://www.cnblogs.com/fnng/p/3576154.html

这个是虫师的博客网站

这个知识点就是在这上面学的

我来说几个点:

1.urllib.request

技术分享

查阅文档可知,python3里的方法和python2不太一样

2.编码格式问题

技术分享

这样改就可以了

3.爬虫 在我看来无非就是爬取自己想要的东西

如何去选择自己想要的呢?

这里我想说   其实在下面这段代码里面最主要的是那个正则表达式

之后的爬虫最主要的也是你自己所写的正则表达式

推荐一个学习正则表达式的网址:http://www.oschina.net/question/12_9507?fromerr=wosLB4sn

 

 完整代码 如下:

 

技术分享

 

爬虫+python3(网页图片)

标签:代码   question   正则表达式   自己   问题   爬取   bsp   ges   blog   

原文地址:http://www.cnblogs.com/wm1012/p/6703242.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!