这一章比较简单,内容也比较少。而且对于文件的读写,还是使用pandas比较好。numpy主要是读写文本数据和二进制数据的。 将数组以二进制的格式保存到硬盘上 主要的函数有numpy.save和numpy.load。默认情况下,数组是以未压缩的二进制保存为.npy的文件。 将多个数组保存到一个压缩文件 ...
分类:
编程语言 时间:
2018-04-06 15:17:26
阅读次数:
335
创建rdd的两种方式:1)loading an external dataset eg:lines = sc.parallelize(List("pandas","numpy"))#一次性导入整个dataset 因而不被广泛使用 2) distrbuting a collection of obje ...
分类:
其他好文 时间:
2018-04-04 23:24:00
阅读次数:
169
pandas 学习总结 作者:csj 更新时间:2018.04.02 shenzhen email:59888745@qq.com home: http://www.cnblogs.com/csj007523/p/8149929.html 1.import 2.export 3.create obj ...
分类:
其他好文 时间:
2018-04-02 20:09:24
阅读次数:
167
html文件 <form>中,enctype设置为multipart/form-data,才能完整的传递文件数据。 后端 ...
分类:
编程语言 时间:
2018-03-29 19:15:06
阅读次数:
1365
结果: date key values0 2017-05-01 a 2.5621571 2017-05-02 b 9.6048232 2017-05-03 c 4.7709683 2017-05-01 d 0.6548784 2017-05-02 a 8.8392815 2017-05-03 b 1 ...
分类:
编程语言 时间:
2018-03-29 14:55:59
阅读次数:
572
引入方式 准备数据 列出前5行数据 4.1.2 索引行列序列 4.2.1 数据整体分析 4.2.2 索引选取和切片选择 iloc配合行索引数值及列索引数值选取切片 根据列名混合选择 4.2.3 逻辑条件进行数据筛选 4.2.4 数据转换与规整 4.2.5 数据本地序列化操作 ...
分类:
编程语言 时间:
2018-03-28 14:17:16
阅读次数:
556
结果: 结果: 结果: one two a 1.0 NaN b 2.0 2.0 c 4.0 3.0 d NaN 4.0 one a 1 b 2 c 4 two b 2 c 3 d 4 dtype: int64 #修补 df1 = pd.DataFrame([[np.nan,3,5],[-1,6,np ...
分类:
其他好文 时间:
2018-03-27 18:38:25
阅读次数:
436
Numpy本身并没有提供多么高级的数据分析功能,理解 Numpuy 数组以及面向数组的计算将有助于你更加高效的使用诸如 pandas 之类的工具 Pyhton 中用列表保存一组值,可将列表当成是数组使用。此外,Python 有 array 模快,但他不支持多维数组,无论是列表还是 array 模块都 ...
分类:
编程语言 时间:
2018-03-27 12:32:02
阅读次数:
211