码迷,mamicode.com
首页 > 其他好文 > 详细

爬虫。。。(哔哩哔哩)

时间:2020-05-03 23:06:35      阅读:157      评论:0      收藏:0      [点我收藏+]

标签:但我   nbsp   数据处理   网站   大海   数据   类型   爬取   src   

零、目的:

  掌握爬虫的使用方法,在B站上爬取出有用的信息来节省流量(bushi)

一、实现:

  首先,进行了最初级的实验,将数据“爬”出来

代码如下:技术图片

 

结果令人眼花缭乱》》》技术图片

 

二、改进:

于是乎,尝试将那些多余的标签什么的去掉,结果(= =)

技术图片

 

 技术图片

 

 技术图片

 

 不出所料,之前我掌握的数据处理技巧对这个数据类型“束手无策”

 技术图片

果真,一开始就上手这个看起来这么复杂的网站还是有一点难度的~~~~~~~~~~~~

 

三、总结:

  学无止境,数据的大海在眼前,而我们只能在岸边捡捡贝壳。但我相信不断努力、学习进步,终有一天能中流击水,浪遏飞舟。

技术图片(失败的尝试)

 

 技术图片

 

爬虫。。。(哔哩哔哩)

标签:但我   nbsp   数据处理   网站   大海   数据   类型   爬取   src   

原文地址:https://www.cnblogs.com/wjcdd/p/12824450.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!