一般语法格式Series.str.method()。具体方法见http://pandas.pydata.org/pandas-docs/stable/api.html#string-handling 例如 作用:Convert strings in the Series/Index to be ca ...
分类:
其他好文 时间:
2017-09-06 15:37:30
阅读次数:
215
数据来源见前边的几篇随笔 对其中的一列排序 可以看到返回的是一个Series 我们也可以对整个DataFrame进行排序 优先按high排序,high有相同的,按lower排序 ...
分类:
编程语言 时间:
2017-09-05 22:01:12
阅读次数:
203
近日,在 Stack Overflow 全球移动开发者分布的调查报告中发现,相较于高收入的国家,Android 在低收入国家应用得更加广泛。 ...
分类:
编程语言 时间:
2017-09-05 21:59:58
阅读次数:
156
同样,引入一个DataFrame 然后使用drop()函数,删除了换手率‘turnover’列,如下: 如需删除多列,可以将data.drop('turnover', axis=1, inplace=True)中的‘turnover’,改成一个需要删除列(列名的)字符串list。 删除行 list内 ...
分类:
其他好文 时间:
2017-09-05 20:53:41
阅读次数:
484
摘要:pandas是一个强大的Python数据分析工具包,pandas的两个主要数据结构Series(一维)和DataFrame(二维)处理了金融,统计,社会中的绝大多数典型用例科学,以及许多工程领域。在Spark中,python程序可以方便修改,省去java和scala等的打包环节,如果需要导出文 ...
分类:
编程语言 时间:
2017-09-02 15:29:09
阅读次数:
157
使用格式:DataFrame.describe(percentile_width=None, percentiles=None, include=None, exclude=None) 作用:生成各种汇总统计信息,不包括代表非数字值的特殊值。 参数: 1.percentile_width:Float ...
分类:
其他好文 时间:
2017-08-31 14:35:42
阅读次数:
357
Numpy NumPy是高性能科学计算和数据分析的基础包。它是pandas等其他各种工具的基础。 NumPy的主要功能: ndarray,一个多维数组结构,高效且节省空间 无需循环对整组数据进行快速运算的数学函数 读写磁盘数据的工具以及用于操作内存映射文件的工具 线性代数、随机数生成和傅里叶变换功能 ...
分类:
编程语言 时间:
2017-08-30 13:09:20
阅读次数:
271
默认在open(‘data.csv’,'w+')模式下会有空行。在open后面添加newline=‘’ 即可解决。 https://stackoverflow.com/questions/41045510/pandas-read-csv-ignore-rows-after-a-blank-line ...
分类:
编程语言 时间:
2017-08-27 11:56:20
阅读次数:
174
#coding:utf-8import numpy as npimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus'] ...
分类:
其他好文 时间:
2017-08-24 20:13:14
阅读次数:
567