做数据分析的同学大部分入门都是从excel开始的,excel也是微软office系列评价最高的一种工具。 但当数据量很大的时候,excel就无能无力了,python第三方包pandas极大的扩展excel的功能,入门需要花费一点时间,但是真的是做大数据的必备神器! 1.从文件读数据 pandas支持 ...
分类:
编程语言 时间:
2017-03-13 18:43:45
阅读次数:
323
outline 数值计算 numpy? 数据处理分析 pandas? 可视化 matplotlib/seaborn? 机器学习 Sklearn / keras? 交互 pygame? 网络 Selenium etc…(今天讲红色字) seaborn What is Machine Learning? ...
分类:
编程语言 时间:
2017-03-10 20:27:16
阅读次数:
162
快速入门1–实现K-Means聚类算法 环境: 虚拟机 版本:0.12.0(仅使用cpu下,pip命令安装) 目录 1.环境搭建 的安装 1.2简单测试 学习文档 相关的库Seaborn、pandas安装 实现K-Means聚类算法 2.1最基本的K-Means聚类算法步骤 实现K-Means聚类算 ...
分类:
编程语言 时间:
2017-03-06 14:23:11
阅读次数:
275
在pandas里面,另一种数据何必运算也被称为连接(concatenation)、绑定(binding)或堆叠(stacking)。 Numpy的轴向连接, concatenation Numpy有一个用于合并原始Numpy数组的concatenation函数: pandas --Series--c ...
分类:
其他好文 时间:
2017-03-06 14:13:02
阅读次数:
1362
基础库 pandas:python的一个数据分析库(pip install pandas) seaborn:数据可视化 (pip install seaborn) matplotlib:数据可视化 (pip install matplotlib) sklearn:建模,科学计算库(pip insta ...
分类:
编程语言 时间:
2017-03-05 23:01:42
阅读次数:
217
1.引用Pandas import pandas as pd 2.创建DataFrame bb=pd.DataFrame(enron_data) 3.查看列 & 行 dataFrame.shape[1] dataFrame.shape[0] 4.选择 选择行: data.loc['a',['w',' ...
分类:
其他好文 时间:
2017-03-05 17:26:14
阅读次数:
206
层次化索引 层次化索引(hierarchical indexing)是pandas的一项重要功能, 它使你能在一个轴上拥有多个(两个以上)索引级别。 抽象点说,它使你能以低维度形式处理高维度数据。 先看个Series例子: 对于一个层次化索引的对象, 选取数据子集的操作很简单: 有时甚至还可以在“内 ...
分类:
其他好文 时间:
2017-02-24 18:11:24
阅读次数:
319
1. 引言 Pandas是一个开源的Python数据分析库。Pandas把结构化数据分为了三类: Series,1维序列,可视作为没有column名的、只有一个column的DataFrame; DataFrame,同Spark SQL中的DataFrame一样,其概念来自于R语言,为多column ...
分类:
数据库 时间:
2017-02-22 18:13:26
阅读次数:
1151
apply Numpy 的ufuncs通用函数(元素级数组方法)也可用于操作pandas对象: 另一个常见的操作是,将函数应用到由各列或行所形成的一维数组上。Dataframe的apply方法即可实现此功能: sum 和mean 许多最为常见的数组统计功能都被实现成DataFrame的方法(如sum ...
分类:
其他好文 时间:
2017-02-20 16:44:07
阅读次数:
234
Pandas 讲解 Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。 Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。 pandas提供了大量能使我们快速便捷地处理数 ...
分类:
其他好文 时间:
2017-02-20 16:43:35
阅读次数:
1177