Numpy Numpy是python的一个库。支持维度数组与矩阵计算并提供大量的数学函数库。 Pandas pandas 处理时间序列,缺失数据的处理。 上面numpy,pandas有很多东西没说,还是要实战才容易记住,多多加油吧! ...
分类:
编程语言 时间:
2016-09-09 15:11:00
阅读次数:
271
1. 取kylin 数据import requestsimport pandas as pddef getDtu(dtuid,addr): sqlData = '{ "sql":"select * from dtu where dtuid=\'%s\' and addr=\'%s\' order b... ...
分类:
其他好文 时间:
2016-09-05 17:09:23
阅读次数:
257
数据分析 (电影数据) import pandas as pd uname = ['user_id', 'gender', 'age', 'occupation', 'zip'] fuser = '//home//yunpiao//data/1M//users.dat' fmovie = '/hom... ...
分类:
其他好文 时间:
2016-09-04 22:12:53
阅读次数:
276
数据转换指的是对数据的过滤、清理以及其他的转换操作。 移除重复数据 DataFrame里经常会出现重复行,DataFrame提供一个duplicated()方法检测各行是否重复,另一个drop_duplicates()方法用于丢弃重复行: duplicated()和drop_duplicates() ...
分类:
编程语言 时间:
2016-08-14 17:49:31
阅读次数:
279
字符串对象方法 split()方法拆分字符串: strip()方法去掉空白符和换行符: split()结合strip()使用: "+"符号可以将多个字符串连接起来: join()方法也是连接字符串,比较它和"+"符号的区别: in关键字判断一个字符串是否包含在另一个字符串中: index()方法和f ...
分类:
编程语言 时间:
2016-08-14 10:10:53
阅读次数:
221
层次化索引 层次化索引指你能在一个数组上拥有多个索引,例如: 有点像Excel里的合并单元格对么? 根据索引选择数据子集 以外层索引的方式选择数据子集: 以内层索引的方式选择数据: 多重索引Series转换为DataFrame 层次化索引在数据重塑和分组中扮演着很重要的角色,例如,上面的层次化索引数 ...
分类:
编程语言 时间:
2016-08-13 18:00:37
阅读次数:
214
pandas 提供了三种主要方法可以对数据进行合并: pandas.merge()方法:数据库风格的合并; pandas.concat()方法:轴向连接,即沿着一条轴将多个对象堆叠到一起; 实例方法combine_first()方法:合并重叠数据。 pandas.merge()方法:数据库风格的合并 ...
分类:
编程语言 时间:
2016-08-12 11:52:22
阅读次数:
192