pandas 是基于numpy构件的强大的数据处理模块,其核心的数据结构有两个:Series 与 DataFrame一:Series Series 是一种类似于表的东西,拥有索引(index)与其对应的值(value) 1)创建Series: Sereies方法接收两个参数,第一个与val...
分类:
其他好文 时间:
2015-12-12 15:27:43
阅读次数:
248
import numpy as npimport matplotlib.pyplot as pltimport pandas as pd #df = pd.read_excel('/Users/NaCl/Documents/first.xls')#df = pd.read_excel("Users....
分类:
编程语言 时间:
2015-12-11 15:09:40
阅读次数:
277
pandas是本书后续内容的首选库。pandas可以满足以下需求: 具备按轴自动或显式数据对齐功能的数据结构。这可以防止许多由于数据未对齐以及来自不同数据源(索引方式不同)的数据而导致的常见错误。. 集成时间序列功能 既能处理时间序列数据也能处理非时间序列数据的数据结构 数学运算和简约(比如对某个轴...
分类:
编程语言 时间:
2015-11-30 10:05:18
阅读次数:
252
1.创建RDDval lines = sc.parallelize(List("pandas","i like pandas"))2.加载本地文件到RDDval linesRDD = sc.textFile("yangsy.txt")3.过滤 filter 需要注意的是 filter并不会在原有RD...
分类:
其他好文 时间:
2015-11-28 14:52:54
阅读次数:
213
第四章 Numpy基础:数组和矢量计算 实话说,用numpy的主要目的在于应用矢量化运算。Numpy并没有多么高级的数据分析功能,理解Numpy和面向数组的计算能有助于理解后面的pandas.按照课本的说法,作者关心的功能主要集中于: 用于数据整理和清理、子集构造和过滤、转换等快速的矢量化运算 常用...
分类:
编程语言 时间:
2015-11-27 12:46:54
阅读次数:
173
译自GeoPandas 0.1.0 文档 GeoPandas是一个开源项目,它的目的是使得在Python下更方便的处理地理空间数据。GeoPandas扩展了pandas的数据类型,允许其在几何类型上进行空间操作。几何操作由shapely执行。GeoPandas进一步依赖于fiona进行文件存取和d....
分类:
其他好文 时间:
2015-11-23 16:19:04
阅读次数:
2487
先决条件:Python环境然后装了下模块Beautifulsoup4,lxml,requests笔者当然推荐Anaconda了,在此基础上pip或者conda安装就行如,C:\>condainstalllxmlbeautifulsoup4requests其实爬下来倒不是很难,不管是requests还是urllib,一下就能把页面download下来,在抓下来之后的..
分类:
其他好文 时间:
2015-11-19 19:12:25
阅读次数:
422
按照此顺序安装吧~1. Python2.7:地址:https://www.python.org/ftp/python/2.7.10/python-2.7.10.msi选择32位的软件哦,名字为Windows x86 MSI installer。安装方法:直接运行,要注意安装地址选择C盘2. nump...
分类:
编程语言 时间:
2015-11-12 18:13:52
阅读次数:
339
环境centos:6.5安装numpypandasmatplotlibseabornscipy首先安装这些包的一些依赖不然用pip安装不了这些yum-yinstallblasblas-devellapack-devellapack
yum-yinstallseabornscipy
yum-yinstallfreetypefreetype-devellibpnglibpng-devel然后用豆瓣的pypi源要比官方的快很多pipi..
分类:
其他好文 时间:
2015-11-09 19:19:47
阅读次数:
230
1、df.dropna() 可以返回去掉NaN的df结果集。2、pandas中dataframe取差集:df=pd.DataFrame({"name":[1,2,3,np.NaN,8],"value":[3,4,np.NaN,9,0]})drop_na_df=df.dropna()na_symbol...
分类:
其他好文 时间:
2015-11-09 15:44:04
阅读次数:
746