码迷,mamicode.com
首页 > 其他好文 > 详细

用Beautifulsoup 来爬取贴吧图片

时间:2017-05-02 16:48:18      阅读:160      评论:0      收藏:0      [点我收藏+]

标签:code   find   pen   网页   文件   class   dir   logs   mil   

import urllib.request
import bs4
import  re
import os

url="https://tieba.baidu.com/p/1988291937?fr=ala0&pstaala=1&tpl=5&isgod=0"
html=urllib.request.urlopen(url)
bsobj=bs4.BeautifulSoup(html)    #将整个网页的标签提取出来

namelist=bsobj.findAll(img,{class:BDE_Image})#找到img标签 并放到集合中

foder=c://hand‘   建立一个文件夹
os.mkdir(foder)
os.chdir(foder)

for name in namelist:
    addr=name.attrs[src] #迭代每一条标签src属性
    filename=addr.split(/)[-1]
    urllib.request.urlretrieve(addr,filename,None)


另一种迭代并保存网页图片的方式
 for name in namelist:
# addr=name.attrs[‘src‘] #迭代每一条标签src属性
# filename=addr.split(‘/‘)[-1]
# with open(filename,‘wb‘) as f:
# response = urllib.request.urlopen(addr)
# img = response.read()
# f.write(img)




用Beautifulsoup 来爬取贴吧图片

标签:code   find   pen   网页   文件   class   dir   logs   mil   

原文地址:http://www.cnblogs.com/caojunjie/p/6796711.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!