码迷,mamicode.com
首页 >  
搜索关键字:Pandas    ( 2752个结果
第一章:Pandas概论
Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近,其区别是:List中的元素可以是不同的数据类型,而Array和Series中则只允许存储相同的数据类型,这样可以更有效的使用内存,提高运算效率。 Time- Series:以时间为索引的Se ...
分类:其他好文   时间:2016-05-14 18:56:35    阅读次数:129
pandas中计算总体标准差
标准差(或方差),分为 总体标准差(方差)和 样本标准差(方差)。 前者分母为n,后者为n-1。后者是无偏的。 pandas里的 .std() 和 .var() 都是算的无偏的。 而numpy是有偏的。 那么在pandas里想算有偏的(即总体标准差或总体方差),怎么做? https://github ...
分类:其他好文   时间:2016-05-13 07:56:57    阅读次数:11419
地铁译:Spark for python developers --- 搭建Spark虚拟环境1
一个多月的地铁阅读时光,阅读《Spark for python developers》电子书,不动笔墨不看书,随手在evernote中做了一下翻译,多年不习英语,自娱自乐。周末整理了一下,发现再多做一点就可基本成文了,于是开始这个地铁译系列。 为开发搭建一个独立的虚拟环境,通过Spark和Anaconda提供的PyData 库为该环境补充能力。 这些库包括Pandas,Scikit-Learn, Blaze,...
分类:编程语言   时间:2016-05-12 22:46:40    阅读次数:299
数据分析框架Pandas入门
数据结构:SeriesSeries是一种类似一维数组的数据结构,输出时会同时显示索引和值In [6]: a = Series([3,5,2]) In [7]: a Out[7]: 0 3 1 5 2 2 dtype: int64分别得到索引和值In [10]: a.values Out[10]: array([3, 5, 2], dtype=int64)In [11]: a.ind...
分类:其他好文   时间:2016-05-12 20:21:25    阅读次数:227
python爬虫--百度风云榜--pandas画趋势图
好久没有更新博客,最近做了一个小项目,利用python爬虫功能,每天记录爬取百度风云榜的数据,然后画出趋势图,从而预测旅游城市热度。 原本准备用pandas直接读取table,后来发现pandas不能打包成exe,就只能放弃,尝试了petl也失败了。 在画图的过程中出现了中文无法显示的问题,查询得出 ...
分类:编程语言   时间:2016-05-10 12:40:25    阅读次数:775
python学习2016.4.1
(1)pandas.Series.value_counts:返回对象中包含唯一值个数, Series.value_counts(normalize=False, sort=True, ascending=False, bins=None,dropna=True) 参数: normalize : boolean, default False 如果True则返回coun...
分类:编程语言   时间:2016-05-07 09:35:42    阅读次数:187
pandas/excel 获得sheet名 修改数据多个sheet 行该列 列排序 归一输出
...
分类:编程语言   时间:2016-05-05 17:12:53    阅读次数:344
how to use panda
0.Introduce pandas.read_csv(filepath_or_buffer,sep=', ', dialect=None, compression='infer', doublequote=True, escapechar=None, quotechar='"', quoting= ...
分类:其他好文   时间:2016-05-02 07:06:26    阅读次数:309
1371 - Energetic Pandas
1371 - Energetic Pandas PDF (English) Statistics Forum Time Limit: 2 second(s) Memory Limit: 32 MB There are n bamboos of different weights Wi. There ...
分类:其他好文   时间:2016-05-01 16:13:20    阅读次数:209
比萨铁塔——统计显著性检验
Dataset 比萨斜塔是意大利最大的旅游景点之一。几百年来这座塔慢慢靠向一边,最终达到5.5度的倾斜角度,在顶端水平偏离了近3米。年度数据pisa.csv文件记录了从1975年到1987年测量塔的倾斜,其中lean代表了偏离的角度。在这个任务,我们将尝试使用线性回归来估计倾斜率以及解释其系数和统计数据。 # 读取数据 import pandas import matplotlib.pyplot...
分类:其他好文   时间:2016-04-29 17:43:46    阅读次数:257
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!