码迷,mamicode.com
首页 > 其他好文 > 详细

也是刚学的时候写的代码 学会了requests 方便多了

时间:2018-08-11 23:21:53      阅读:186      评论:0      收藏:0      [点我收藏+]

标签:tps   blog   保存   信息   文件路径   保存图片   pat   写入   print   

import requests
import time
import re
import os
i = 0
num = 0
newurl = "/blog/?id=800563506"
for i in range(2):
i += 1
baseurl = "https://www.duitang.com"
baseurl2 = newurl
url = baseurl + baseurl2
rsp = requests.get(url)
#print(type(rsp))
data = rsp.text
#print(type(data))


#获取帖子中间 图片名称 和想要爬取得图片信息块
s =r‘<div class="de-img"(.*?)</div>‘
pattern = re.compile(s,re.S)
keydata = pattern.findall(data)
keydata = "".join(keydata)
#print(type(keydata))
#print(keydata)

#获取下一张图的后半截 url
s1 = r‘<a class="shownext" href="(.*?)" data-nextid=‘
pattern1 = re.compile(s1,re.S)
newurl = pattern1.findall(keydata)[0]
newurl = "".join(newurl)
print(type(newurl))
print(newurl)


#获取名称
s2 =r‘<img alt="(.*?)" id=‘
pattern2 = re.compile(s2,re.S)
mingcheng = pattern2.findall(keydata)[0]
#mingcheng = "".join(mingcheng)
print(mingcheng)

#获取图片地址
s3 =r‘src="(.*?)" style=‘
pattern3 = re.compile(s3,re.S)
tupian = pattern3.findall(keydata)[0]
tupian = "".join(tupian)
print(tupian)

tupiandizhi = requests.get(tupian) #对图片地址发出请求
#print(type(tupiandizhi))

#给名字添加数字 以免被后来者覆盖
num = num + 1
num2 = str(num)
savepng = open("F://"+ mingcheng + num2 +".png","wb").write(tupiandizhi.content) #将图片保存
#open(文件路径,名字+数字+后缀,写入方法) #.content是将数据直接返回bytes类型,这样就可以保存图片 音乐等文件

也是刚学的时候写的代码 学会了requests 方便多了

标签:tps   blog   保存   信息   文件路径   保存图片   pat   写入   print   

原文地址:https://www.cnblogs.com/cwkcwk/p/9461382.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!