介绍对于绘制某些类型的数据来说,瀑布图是一种十分有用的工具。不足为奇的是,我们可以使用Pandas和matplotlib创建一个可重复的瀑布图。在往下进行之前,我想先告诉大家我指代的是哪种类型的图表。我将建立一个维基百科文章中描述的2D瀑布图。这种图表的一个典型的用处是显示开始值和结束值之间起“桥梁...
分类:
编程语言 时间:
2015-04-22 11:23:26
阅读次数:
199
# coding=gbk'''选择用户反馈的物品将评分>3定义为喜欢'''import pandas as pdimport numpy as npimport copy#获取区分度def getDiff(userRates,movie): like=dict() dislike=dic...
分类:
其他好文 时间:
2015-04-13 14:36:14
阅读次数:
157
1. 将环境变量PATH中加入C:\python2*\Scripts 或者C:\Program Files\Python 3.5\Scripts2. 进入pip.exe所在的目录:C:\Program Files\Python 3.5\Scripts3. pip3.5 install pandasD...
分类:
其他好文 时间:
2015-04-08 06:34:13
阅读次数:
172
一. 安装pandas1. Anaconda 安装pandas、Python和SciPy最简单的方式是用Anaconda。Anaconda是关于Python数据分析和科学计算的分发包。2. Miniconda 使用Anaconda会安装一百多个依赖包,如果想灵活控制安装的依赖包或带宽有限,使用Min...
分类:
其他好文 时间:
2015-04-08 06:30:47
阅读次数:
267
为了将列表转换为二维透视表,之前自己写过代码,今天看到pandas直接有这个方法,感觉简单顺手多了,故重写了社会特征属性的人口矩阵和距离矩阵分离的代码,首先介绍一下pivot_table:pandas.tools.pivot.pivot_...
分类:
其他好文 时间:
2015-04-03 13:38:00
阅读次数:
158
查询写入操作 pandas可以类似sql一样有强大的查询功能,而且写法简单: print?tips[[‘total_bill‘,?‘tip‘,?‘smoker‘,?‘time‘]]
#显示‘total_bill‘,?‘tip‘,?‘smoker‘,?‘time‘列,功能类似于sql中的select命令...
分类:
其他好文 时间:
2015-03-20 11:10:15
阅读次数:
140
插入列# -*- coding: utf-8 -*-"""Created on Mon Mar 09 11:21:02 2015@author: myhaspl@myhaspl.com"""print u"python数据分析\n"import pandas as pdimport numpy as np#构造商品销量数据mydf = pd.DataFrame({u'商品地区编码':[1,1,3,...
分类:
编程语言 时间:
2015-03-10 12:13:45
阅读次数:
266
目前,网上已有成千上万个Python包,但几乎没有人能够全部知道它们。单单PyPi上就有超过47000个包列表。 现在,越来越多的数据科学家开始使用Python,虽然他们从pandas,scikit-learn,numpy中获得了不少好处,但我仍想向他们介绍一些年长且非常实用的Python库。在.....
分类:
编程语言 时间:
2015-03-10 11:37:41
阅读次数:
182
Pandas基础import pandas aspdimport numpy as np#数字序列myseries=pd.Series([1,3,5,np.nan,6,8])print myseries#日期序列mydate=pd.date_range('20150101',periods=42)print mydate生成序列结果如下:0 11 32 53 NaN4 6...
分类:
编程语言 时间:
2015-03-09 12:52:54
阅读次数:
228
anaconda内部集成ipython、scipy和numpy基本都齐了,很好用!下载地址http://pan.baidu.com/s/1o6OEPIipython大数据处理模块pandas由scipy和numpy组成,这核心模块都在anaconda里预装了
分类:
编程语言 时间:
2015-03-04 06:22:36
阅读次数:
229