码迷,mamicode.com
首页 > 微信 > 详细

爬虫小程序 - 王者荣耀全皮肤爬取

时间:2020-03-03 11:13:36      阅读:120      评论:0      收藏:0      [点我收藏+]

标签:group   链接   gen   split   class   head   ref   with open   pytho   

爬虫小程序 - 王者荣耀全皮肤爬取

  • 代码如下所示(可直接复制使用):

import requests
import re
import os
'''
ps: 出现 <Response [405]>  多运行几次就好了
'''

def Downloed_ksin(ename, **kwargs):
    # 英雄详情页
    url = 'https://pvp.qq.com/web201605/herodetail/' + ename + '.shtml'
    html = session.get(url=url, headers=header)
    html.encoding = html.apparent_encoding
    # 获取皮肤名称
    skin_name = re.search(r'data-imgname="(.*?)">', html.text).group(1).split('|')
    infor = {}
    for num in range(len(skin_name)):
        infor[skin_name[num]] = 'https://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/' + ename + '/' + ename + '-bigskin-' + str(num+1) + '.jpg'
    # 返回 {皮肤名称:链接} 形式
    return infor

url_post = 'https://pvp.qq.com/web201605/js/herolist.json'
header = {
    "User-Agent": "Mozilla/5.0 (Windows NT 6.6; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36",
    "Referer": "https://pvp.qq.com/web201605/herolist.shtml",
}
session = requests.session()
html = session.post(url=url_post, headers=header)
print(html)
for property in html.json():
    ename = str(property["ename"])  # 获取英雄编号
    cname = property['cname']  # 获取英雄名称
    print(cname)
    skin_url = Downloed_ksin(ename)  # 得到 {皮肤名称:链接} 形式
    os.makedirs('王者荣耀全皮肤' + '/' + str(cname))  # 创建目录
    for v, k in skin_url.items():
        img = requests.get(url=k, headers=header).content
        with open('王者荣耀全皮肤' + '/' + str(cname) + '/' + v + '.jpg', 'wb+') as imgfile:
            imgfile.write(img)
  • 运行代码后,就会生成高清图片,文件生成地在代码同级目录下.


目前只有隐藏英雄艾琳没有之外,其他图片暂时都会有.

爬虫小程序 - 王者荣耀全皮肤爬取

标签:group   链接   gen   split   class   head   ref   with open   pytho   

原文地址:https://www.cnblogs.com/chao460/p/12400739.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!