s+可以将tab和多个空格都当成一样的分隔符。skiprows代表忽略文件开始的7行注释之类内容。 ...
分类:
其他好文 时间:
2017-07-12 01:10:18
阅读次数:
796
一:pandas的数据类型 pandas中最重要的数据类型是Series序列 和 DataFrame数据框,Series相当于Numpy中的一维数组,不同之处series会自带索引值。dataframe相当于numpy的二维数组。 1.1)Series的创建 有两种方式:通过一维数组 和 字典 1) ...
分类:
编程语言 时间:
2017-07-10 22:04:05
阅读次数:
377
手头现在有一份福布斯2016年全球上市企业2000强排行榜的数据,但原始数据并不规范,需要处理后才能进一步使用。 本文通过实例操作来介绍用pandas进行数据整理。 ...
分类:
其他好文 时间:
2017-07-10 19:12:55
阅读次数:
294
1.ubuntu镜像源准备(防止下载过慢): 参考博文:http://www.cnblogs.com/top5/archive/2009/10/07/1578815.html 步骤如下: 首先,备份一下ubuntu 12.10 原来的源地址列表文件 sudo cp /etc/apt/sources. ...
分类:
系统相关 时间:
2017-07-10 13:20:20
阅读次数:
3208
用广晟有色的历史数据,用sklearn进行回归,数据如下: 假设每日振幅和成交量以及价格是有关系的,于是构造:# coding=utf-8 from pandas import Series,DataFrame import pandas as pd import numpy as np from ... ...
分类:
其他好文 时间:
2017-07-08 12:25:00
阅读次数:
480
存入字典resul{}中--通过循环将每则新闻信息append到最后的列表alllist--使用pandas函数、DataFrame方法将列表整理,最终导出为excel表格 ...
分类:
其他好文 时间:
2017-07-08 12:15:57
阅读次数:
175
NumPy是一个开源的Python科学计算基础库,包含: ? 一个强大的N维数组对象 ndarray ? 广播功能函数 ? 整合C/C++/Fortran代码的工具 ? 线性代数、傅里叶变换、随机数生成等功能NumPy是SciPy、 Pandas等数据处理或科学计算库的基础 NumPy的引用: im ...
分类:
其他好文 时间:
2017-07-07 22:38:16
阅读次数:
238
定义一个dataframe: >>> df a b0 1 31 2 4 现在看两种用法: 1.求行的均值 >>> df.mean(axis=1)0 2.01 3.0dtype: float64 2.删除列 >>> df.drop('a',axis=1) b0 31 4 乍看不好理解,但是,记住这句话 ...
分类:
其他好文 时间:
2017-07-07 13:11:30
阅读次数:
238
导入模块: 生成DataFrame数据 DataFrame数据预览: 计算各列数据总和并作为新列添加到末尾 计算各行数据总和并作为新行添加到末尾 最终数据结果: 2017-07-07 11:19:54 ...
分类:
其他好文 时间:
2017-07-07 13:08:21
阅读次数:
471
使用pandas进行数据处理,主要有对某列数据事先进行提取,提取其中的identifier。用到的操作就是df['column'] = df['column'].apply(). 对数据处理完之后用到的就是matplotlib package,这时需要使用 command ipython --pyl ...
分类:
其他好文 时间:
2017-07-04 11:18:55
阅读次数:
156