码迷,mamicode.com
首页 > 其他好文 > 详细

bibli直播弹幕实时爬取

时间:2019-03-22 18:58:55      阅读:458      评论:0      收藏:0      [点我收藏+]

标签:info   图片   requests   一个   orm   erer   rom   abc   技术   

1 分析数据来源

  •    在不知道弹幕信息在哪里的时候,只能去all里面查看每一个相应的信息,看信息是否含有弹幕信息
  •    在知道弹幕信息文件的时候,我们可以直接用全局文件搜索,定位到弹幕数据文件.操作如下图

技术图片

 

 

2 查看文件的请求信息

技术图片

 

3 查看请求头信息,构建请求头

技术图片

 

  • 请求头;
headers={
    Content-Type:application/x-www-form-urlencoded,
    Origin: https://live.bilibili.com,
    Referer:https://live.bilibili.com/5225369?spm_id_from=333.334.b_62696c695f6c697665.5,
    User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36,
}

 

  •  请求体数据
data={ 
    roomid: ‘7734200, #房间号
    csrf_token: ‘fa56950667934cf5a3479ca94abc1f9a,
    csrf: ‘fa56950667934cf5a3479ca94abc1f9a,
    visit_id: ‘‘,
}

 

 

4 代码

import requests
import time

#请求头 headers
={ Content-Type:application/x-www-form-urlencoded, Origin: https://live.bilibili.com, Referer:https://live.bilibili.com/5225369?spm_id_from=333.334.b_62696c695f6c697665.5, User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36, }
#请求体 data
={ roomid: 7734200, csrf_token: fa56950667934cf5a3479ca94abc1f9a, csrf: fa56950667934cf5a3479ca94abc1f9a, visit_id: ‘‘, } url=https://api.live.bilibili.com/ajax/msg

#实时请求数据 while True: time.sleep(2) response=requests.post(url=url,headers=headers,data=data) dic_data=response.json() # print(type(dic_data)) content=[item[text] for item in dic_data[data][room]] print(content)

 

 5 效果

技术图片

 

bibli直播弹幕实时爬取

标签:info   图片   requests   一个   orm   erer   rom   abc   技术   

原文地址:https://www.cnblogs.com/angle6-liu/p/10579983.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!