码迷,mamicode.com
首页 > 编程语言 > 详细

python爬千千音乐

时间:2018-08-16 00:47:36      阅读:138      评论:0      收藏:0      [点我收藏+]

标签:访问   .json   互联网   传递参数   with open   findall   min   odi   text   

模拟浏览器,访问互联网资源,根据所写的规则,下载所需的音乐数据!

源代码查看:在更多工具里的开发者工具(shift+ctrl+I 或f12)

在谷歌浏览器中登入千千音乐 http://music.taihe.com

在pycharm写代码

在Terminal中输入pip install requests回车即安装requests

技术分享图片

程序代码:

import requests
import re


#第一步 获取歌曲ids
search_api =‘http://music.taihe.com/search
#搜索的关键字,传递参数,通过字典构造
keyword = {‘key‘:‘阿兰‘}
#发送请求
#get请求 params 是传递的get参数
response=requests.get(search_api,params=keyword)
#取出html的源码
response.encoding=‘utf-8‘
html = response.text
#通过正则表达式获取id
ids=re.findall(r‘{"id":"(\d+)"‘,html)
print(ids)
#第二步 获取歌曲的信息
mp3_info_api =‘http://play.taihe.com/data/music/songlink
data ={
‘songIds‘: ‘,‘.join(ids),
‘hq‘: 0,
‘type‘: ‘m4a,mp3‘,
‘rate‘: ‘‘,
‘pt‘: 0,
‘flag‘: -1,
‘s2p‘: -1,
‘prerate‘: -1,
‘bwt‘: -1,
‘dur‘: -1,
‘bat‘: -1,
‘bp‘: -1,
‘pos‘: -1,
‘auto‘: -1
}
#data就是post的参数
res = requests.post(mp3_info_api,data=data)
#返回的数据是json格式 直接调用json方法,转成字典
info = res.json()

#第三步 去下载歌曲
#根据数据的结构,获取歌曲的信息
song_info =info[‘data‘][‘songList‘]
#循环
for song in song_info:
#根据数据结构获取信息
#歌名
song_name = song[‘songName‘]
#mp3地址
song_link = song[‘songLink‘]
#格式
for_mat = song[‘format‘]
#歌词地址
lrclink = song[‘lrcLink‘]
# print(song_name,song_link,for_mat,lrclink)
#下载mp3
if song_link:#有可能没有地址
song_res =requests.get(song_link)
with open(‘%s.%s‘ % (song_name,for_mat),‘wb‘)as f:
f.write(song_res.content)
print(song_link)

#下载歌词
if lrclink:
lrc_response = requests.get(lrclink)
#写文件
with open(‘%s,lrc‘ % song_name, ‘w‘)as f:
f.write(lrc_response.text)

 

  

python爬千千音乐

标签:访问   .json   互联网   传递参数   with open   findall   min   odi   text   

原文地址:https://www.cnblogs.com/lygl/p/9484608.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!