需求:爬取哔哩哔哩网页弹幕内容,并将爬取的内容以五角星的形式显示出来 思路: 实现: 使用到的类库,如果没有,需要下载,下载命令: 知识点: request 向对方服务器发送请求 BeautifulSoup 解析爬取的弹幕内容 pandas 分析弹幕数据 jieba 中文分词器,或称为中文词组切片器 ...
分类:
Web程序 时间:
2019-10-28 20:51:02
阅读次数:
147
Pandas的三种数据结构: 系列(Series) 数据帧(DataFrame) 面板(Panel) 这些数据结构,构建在Numpy数组之上,这意味着它们很快 维数和描述 考虑这些数据结构的最好方法是,较高维数据结构是其较低维数据结构的容器。 例如,DataFrame是Series的容器,Panel ...
分类:
其他好文 时间:
2019-10-28 20:32:58
阅读次数:
87
Excel 文件的格式曾经发生过一次变化,在 Excel 2007 以前,使用扩展名为 .xls 格式的文件,这种文件格式是一种特定的二进制格式,最多支持 65,536 行,256 列表格。从 Excel 2007 版开始,默认采用了基于 XML 的新的文件格式 .xlsx ,支持的表格行数达到了 ...
分类:
其他好文 时间:
2019-10-28 12:56:05
阅读次数:
117
首先,这里有一串比较有说服力的数据:https://cloud.tencent.com/developer/article/1099208 python的优势: 容易学,上手快 包很多,第三方包很多 numpy和pandas很强大 是做机器学习的最佳选择之一 python的劣势: 运行速度,emmm ...
分类:
编程语言 时间:
2019-10-27 00:40:31
阅读次数:
112
Pandas 简介 Series DataFrame 时间对象处理 数据分组和聚合 其他常用方法 一 、简介 pandas是一个强大的Python数据分析的工具包,它是基于Numpy构建的,正因pandas的出现,让Python语言也成为使用最广泛而且强大的数据分析环境之一。 Pandas的主要功能 ...
分类:
其他好文 时间:
2019-10-26 17:37:43
阅读次数:
96
Numpy 简介 ndarray 通用函数 其他 一 、简介 Numpy是高性能科学计算和数据分析的基础包。它也是pandas等其他数据分析的工具的基础,基本所有数据分析的包都用过它。NumPy为Python带来了真正的多维数组功能,并且提供了丰富的函数库处理这些数组。它将常用的数学函数都支持向量化 ...
分类:
其他好文 时间:
2019-10-26 17:07:33
阅读次数:
129
Python之pandas用法 导入 Series 用pandas的Series函数从数组或列表中创建一个可自定义下标(index)并自动维护标号索引的一维数组 其中index和values都是可迭代的对象,并且可以像dict那样进行下标访问 这里有一些小trick 用loc和iloc分别表示访问自 ...
分类:
编程语言 时间:
2019-10-26 01:37:08
阅读次数:
107
import pandas as pd a= pd.read_csv(a_csv_file, usecols=[1]) b= pd.read_csv(b_csv_file, usecols=[1]) a_list = a.values.tolist() b_list = b.values.tolis ...
分类:
其他好文 时间:
2019-10-25 23:23:51
阅读次数:
89
网址:https://www.cnblogs.com/pinard/p/6023000.html 线性回归和交叉验证 import matplotlib.pyplot as plt import numpy as np import pandas as pd from sklearn import ...
分类:
其他好文 时间:
2019-10-25 23:18:26
阅读次数:
82
6.2 二进制数据格式 实现数据的高效二进制格式存储最简单的办法之一,是使用Python内置的pickle序列化。 pandas对象都有一个用于将数据以pickle格式保存到磁盘上的to_pickle方法: 通过pickle直接读取被pickle化的数据,或使用更为方便的pandas.read_pi ...
分类:
编程语言 时间:
2019-10-24 09:44:35
阅读次数:
123