码迷,mamicode.com
首页 >  
搜索关键字:pandas    ( 2752个结果
3.0:pandas【基础操作】
pandas 是基于numpy构件的强大的数据处理模块,其核心的数据结构有两个:Series 与 DataFrame一:Series Series 是一种类似于表的东西,拥有索引(index)与其对应的值(value) 1)创建Series: Sereies方法接收两个参数,第一个与val...
分类:其他好文   时间:2015-12-12 15:27:43    阅读次数:248
python读取excel中的数据
import numpy as npimport matplotlib.pyplot as pltimport pandas as pd #df = pd.read_excel('/Users/NaCl/Documents/first.xls')#df = pd.read_excel("Users....
分类:编程语言   时间:2015-12-11 15:09:40    阅读次数:277
《利用python进行数据分析》读书笔记--第五章 pandas入门
pandas是本书后续内容的首选库。pandas可以满足以下需求: 具备按轴自动或显式数据对齐功能的数据结构。这可以防止许多由于数据未对齐以及来自不同数据源(索引方式不同)的数据而导致的常见错误。. 集成时间序列功能 既能处理时间序列数据也能处理非时间序列数据的数据结构 数学运算和简约(比如对某个轴...
分类:编程语言   时间:2015-11-30 10:05:18    阅读次数:252
spark RDD transformation与action函数巩固 (未完)
1.创建RDDval lines = sc.parallelize(List("pandas","i like pandas"))2.加载本地文件到RDDval linesRDD = sc.textFile("yangsy.txt")3.过滤 filter 需要注意的是 filter并不会在原有RD...
分类:其他好文   时间:2015-11-28 14:52:54    阅读次数:213
《利用python进行数据分析》读书笔记--第四章 numpy基础:数组和矢量计算
第四章 Numpy基础:数组和矢量计算 实话说,用numpy的主要目的在于应用矢量化运算。Numpy并没有多么高级的数据分析功能,理解Numpy和面向数组的计算能有助于理解后面的pandas.按照课本的说法,作者关心的功能主要集中于: 用于数据整理和清理、子集构造和过滤、转换等快速的矢量化运算 常用...
分类:编程语言   时间:2015-11-27 12:46:54    阅读次数:173
GeoPandas使用指南
译自GeoPandas 0.1.0 文档 GeoPandas是一个开源项目,它的目的是使得在Python下更方便的处理地理空间数据。GeoPandas扩展了pandas的数据类型,允许其在几何类型上进行空间操作。几何操作由shapely执行。GeoPandas进一步依赖于fiona进行文件存取和d....
分类:其他好文   时间:2015-11-23 16:19:04    阅读次数:2487
网络爬虫之爬一爬2008奥运会的赛事结果
先决条件:Python环境然后装了下模块Beautifulsoup4,lxml,requests笔者当然推荐Anaconda了,在此基础上pip或者conda安装就行如,C:\>condainstalllxmlbeautifulsoup4requests其实爬下来倒不是很难,不管是requests还是urllib,一下就能把页面download下来,在抓下来之后的..
分类:其他好文   时间:2015-11-19 19:12:25    阅读次数:422
Windos7(32位)安装Python2.7,再加上numpy、scipy、Matplotlib、Ipython、pandas
按照此顺序安装吧~1. Python2.7:地址:https://www.python.org/ftp/python/2.7.10/python-2.7.10.msi选择32位的软件哦,名字为Windows x86 MSI installer。安装方法:直接运行,要注意安装地址选择C盘2. nump...
分类:编程语言   时间:2015-11-12 18:13:52    阅读次数:339
Centos安装各种数据分析库,numpy,pandas,matplotlib,seaborn,scipy
环境centos:6.5安装numpypandasmatplotlibseabornscipy首先安装这些包的一些依赖不然用pip安装不了这些yum-yinstallblasblas-devellapack-devellapack yum-yinstallseabornscipy yum-yinstallfreetypefreetype-devellibpnglibpng-devel然后用豆瓣的pypi源要比官方的快很多pipi..
分类:其他好文   时间:2015-11-09 19:19:47    阅读次数:230
pandas中选取某行为缺失值的数据,并返回
1、df.dropna() 可以返回去掉NaN的df结果集。2、pandas中dataframe取差集:df=pd.DataFrame({"name":[1,2,3,np.NaN,8],"value":[3,4,np.NaN,9,0]})drop_na_df=df.dropna()na_symbol...
分类:其他好文   时间:2015-11-09 15:44:04    阅读次数:746
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!