目前,网上已有成千上万个Python包,但几乎没有人能够全部知道它们。单单PyPi上就有超过47000个包列表。现在,越来越多的数据科学家开始使用Python,虽然他们从pandas,scikit-learn,numpy中获得了不少好处,但我仍想向他们介绍一些年长且非常实用的Python库。在本文中...
分类:
编程语言 时间:
2015-03-03 20:28:21
阅读次数:
190
excel有针对偏度的计算函数 skew(), 但是不清楚怎么使用excel进行遍历, 数据量很大。尝试使用python进行解决。第一次学习python,没想到了在克服安装各种包的难过之后,居然成功实现了。python3.3:#this is a test case# -*- coding: gbk...
分类:
编程语言 时间:
2015-03-03 15:07:02
阅读次数:
311
0_安装python2.7.x
python.org官网下载python2.7
1_numpy下载1.9.1
http://sourceforge.net/projects/numpy/files/NumPy/1.9.1/
下载之后安装即可
2_opencv下载2.4.10
http://sourceforge.net/projects/opencvlibrary/files/...
分类:
编程语言 时间:
2015-02-26 11:42:07
阅读次数:
174
Classification with HDF5 data1.导入库 1 import os 2 import h5py 3 import shutil 4 import sklearn 5 import tempfile 6 import numpy as np 7 import pandas a...
分类:
其他好文 时间:
2015-02-23 06:27:19
阅读次数:
354
适合初学入门
第一课 构造数据
本节基本了解Pandas里的一些数据结构和模块的基本使用,初步了解Pandas的提供的一些功能,学会基本使用。
创建数据
通过Python的zip构造出一元组组成的列表作为DataFrame的输入数据rec。
In [3]: import pandas as pd
In [4]: import random
In [5]: num ...
分类:
编程语言 时间:
2015-02-09 14:10:00
阅读次数:
326
爬虫:scrapy,beautifulsoup自然语言处理:nltk,Pattern(Google,Twitter,andWikipediaAPIs,awebcrawler,aHTMLDOMparser),结巴分词科学计算:NumPy,SciPy,matplotlib机器学习、数据挖掘:scikit-learn,pandas,MDP(neuralnetworks),PyBrain(neuralnetworks),Theano(GPU,deeplearn..
分类:
编程语言 时间:
2015-02-07 19:02:28
阅读次数:
185
def xx_pandas(duiying_path, input_path=None, output_path=None): data = pd.read_excel(duiying_path, sheetname='name') en_ch = {} # 英文字段到中文字段的映射 ...
分类:
其他好文 时间:
2015-02-06 14:33:40
阅读次数:
115
目前,网上已有成千上万个Python包,但几乎没有人能够全部知道它们。单单PyPi上就有超过47000个包列表。现在,越来越多的数据科学家 开始使用Python,虽然他们从pandas,scikit-learn,numpy中获得了不少好处,但...
分类:
编程语言 时间:
2015-01-30 06:46:27
阅读次数:
259
要利用python进行数据分析,pandas必不可少。
作为python数据分析利器,pandas以快速,高效著称。
为了更加方便地处理数据,pandas创造了自己的数据类型:Series,DataFrame。
一般使用pandas要进行如下import:
import pandas as pd
Series
可以认为series类型的包含着一列数据。
In [4]: ...
分类:
其他好文 时间:
2015-01-17 18:08:04
阅读次数:
813
统计方法pandas 对象有一些统计方法。它们大部分都属于约简和汇总统计,用于从 Series 中提取单个值,或从 DataFrame 的行或列中提取一个 Series。比如 DataFrame.mean(axis=0,skipna=True) 方法,当数据集中存在 NA 值时,这些值会被简单跳过,...
分类:
其他好文 时间:
2015-01-08 21:21:22
阅读次数:
246