以下内容为截取自pandas官网的doc(请看这里),我做了一些翻译.Reshaping by pivoting DataFrame objectsData is often stored in CSV files or databases in so-called “stacked” or “re...
作为 easy_install 的升级版,pip 为 Pyhton 的包管理提供了极大的方便。一行命令即可完成所需模块的安装:pip install pandas可是官方镜像的访问速度相当慢,几乎不可用。因此十分有必要修改镜像源来提升访问速度,修改镜像源在不同操作系统中,修改文件的位置是不同的,在l...
分类:
其他好文 时间:
2015-07-10 18:22:26
阅读次数:
182
1. python 与mysql 连接及操作,直接上代码,简单直接高效:import MySQLdb try: conn = MySQLdb.connect(host='localhost',user='root',passwd='×××××',db='test',charset='utf8'...
分类:
数据库 时间:
2015-06-24 12:42:59
阅读次数:
194
mysql数据中都是UTF编码,导出到文件称csv还是xls都是utf-8,用python的pandas读取可以,但每次写代码的时候都需要很小心看文件原来是什么编码 比如如果在read_csv()中没用encoding转换为Unicode编码的话在后面的...
分类:
编程语言 时间:
2015-06-18 07:08:56
阅读次数:
149
因为习惯了使用pandas的DataFrame数据结构,同时pandas作为一个方便计算和表操作的数据结构具有十分显著的优势,甚至很多时候dataFrame可以作为excel在使用,而在用python操作gis的shp文件时很不顺畅,不太符合使...
分类:
其他好文 时间:
2015-06-06 13:40:31
阅读次数:
212
内容概要
如何使用pandas读入数据如何使用seaborn进行数据的可视化scikit-learn的线性回归模型和使用方法线性回归模型的评估测度特征选择的方法
作为有监督学习,分类问题是预测类别结果,而回归问题是预测一个连续的结果。
1. 使用pandas来读取数据
Pandas是一个用于数据...
分类:
其他好文 时间:
2015-06-03 09:45:15
阅读次数:
278
声明工作后,很不幸的成为了团队中的QA。QA这个角色吧,说起来高大上,实际很苦逼,一句话概括一下:吃力不讨好!作为新人,公司每月一分钱没少我,至少现在跟开发的待遇是一样的,所以我还是得兢兢业业的对待自己的工作。项目越做越复杂,写验收测试的时候,往往验收场景容易构造,但是该场景下的预期数据、甚至是原始...
分类:
其他好文 时间:
2015-06-01 00:38:11
阅读次数:
263
import pandas as pdpd.merge(dataframe1,dataframe2,on='common_field',how='outer')replace NaNdataframe1.fillna(0) #replace NaN to 0transform from datafr...
分类:
编程语言 时间:
2015-05-21 12:13:32
阅读次数:
190
首先搭建基本环境,假设已经有Python运行环境。然后需要装上一些通用的基本库,如numpy, scipy用以数值计算,pandas用以数据分析,matplotlib/Bokeh/Seaborn用来数据可视化。再按需装上数据获取的库,如Tushare(http://pythonhosted.org/tushare/),Quandl(https://www.quandl.com/)等。网上还有很多可供分析的免费数据集(http://www.kdnuggets.com/datasets/index.html)。...
分类:
编程语言 时间:
2015-05-17 22:00:37
阅读次数:
495
这不是一个有说服力的测试,算是我的体验吧通过pandas.read_csv函数将总共1.44GB的164个csv文件依次(转为dataframe对象,并新增2条series,再将该dataframe通过pandas.to_sql函数写成1.23GB的sqlite数据库文件,从导入第四个文件后,就越来...
分类:
数据库 时间:
2015-05-16 01:25:24
阅读次数:
658