pandas是基于numpy包扩展而来的,因而numpy的绝大多数方法在pandas中都能适用。 pandas中我们要熟悉两个数据结构Series 和DataFrame Series是类似于数组的对象,它有一组数据和与之相关的标签组成。 import pandas as pd object=pd.S ...
分类:
编程语言 时间:
2016-10-03 00:14:41
阅读次数:
973
DataFrame 类型类似于数据库表结构的数据结构,其含有行索引和列索引,可以将DataFrame 想成是由相同索引的Series组成的Dict类型。在其底层是通过二维以及一维的数据块实现。 1. DataFrame 对象的构建 1.1 用包含等长的列表或者是NumPy数组的字典创建DataFra ...
分类:
其他好文 时间:
2016-09-24 20:20:02
阅读次数:
181
1. Series Series 是一个类数组的数据结构,同时带有标签(lable)或者说索引(index)。 1.1 下边生成一个最简单的Series对象,因为没有给Series指定索引,所以此时会使用默认索引(从0到N-1)。 1.2 当要生成一个指定索引的Series 时候,可以这样: 1.3 ...
分类:
其他好文 时间:
2016-09-24 16:08:59
阅读次数:
116
数据规整化:清理、转换、合并、重塑 1.合并数据集 pandas对象中的数据可以通过一些内置的方式进行合并: pandas.merge pandas.concat:沿一条轴线将多个对象进行堆叠 combine_first:重复数据连接,用一个对象中的值填充另一个缺失值 1.1 数据库风格的DataF ...
分类:
其他好文 时间:
2016-09-22 21:29:06
阅读次数:
501
Numpy 是Numerical Python的简写,用来进行高性能的科学计算以及数据分析的基础包。它是一些高级工具(pandas)的基础。它主要提供以下几个功能: (1). ndarray:计算快,空间效率高的多纬的数组 (2). 快速操作数组的标准数学函数 (3). 向磁盘读写数据的工具,提供内 ...
分类:
其他好文 时间:
2016-09-22 11:26:39
阅读次数:
165
# coding: utf-8 import pandas as pdimport numpy as np summary=pd.read_table('C:/Users/AG_Forcast/TrainData/AGS_shipments_summary/qry_1004366250.txt',k ...
分类:
编程语言 时间:
2016-09-22 01:15:18
阅读次数:
386
# coding: utf-8 import pandas as pdfrom datetime import datetimefrom datetime import timedeltafrom dateutil.parser import parsefrom pandas import Seri ...
分类:
编程语言 时间:
2016-09-21 01:32:40
阅读次数:
222
去掉重复的id,并且存入数据库: 根据网站情况,进行网站的分类: 使用pandas读取数据库进行统计 ...
分类:
Web程序 时间:
2016-09-20 12:05:17
阅读次数:
218
pip可以很方便的安装python的各种工具库,如pandas,matplotlib,scikit等,最大优点是它会自动解决库之间的依赖性,把所有需要的库都安装好,比起手工一个一个安装方便多了。 1. 如何安装pip? win7系统,假如Python的安装目录为D:\Program Files (x ...
分类:
其他好文 时间:
2016-09-19 18:02:05
阅读次数:
355
生成时间序列: dates = pandas.date_range('2013-01-01',periods = 6) Pandas读取excel数据: df=pd.read_excel("mystock.xls") DF排序: df=df.sort('data',ascending=False) ...
分类:
其他好文 时间:
2016-09-16 16:51:32
阅读次数:
117