一.python使用的模块 1.numpy 数据分析的底层数据结构 2.matplotlib 数据可视化模块 3.pandas 数据分析高级接口模块,在前两个的基础上 4.scipy,sklearn 机器学习库,提供算法 ...
分类:
编程语言 时间:
2019-10-19 20:19:47
阅读次数:
104
数据分析 1. 什么是数据分析 : 数据分析:是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律 数据分析三剑客: Numpy,Pandas,Matplotlib 2. Numpy NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支 ...
分类:
其他好文 时间:
2019-10-18 19:07:49
阅读次数:
94
import pandas as pdimport seaborn as snsimport geohashimport matplotlib.pyplot as pltfrom math import radians,cos,sin,asin,sqrt%matplotlib inline trai ...
分类:
其他好文 时间:
2019-10-18 15:47:39
阅读次数:
130
1 一元线性回归 import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression #导入机器学习库中的线性回归模块 dat ...
分类:
其他好文 时间:
2019-10-18 00:01:35
阅读次数:
111
Pandas的数据结构 一、Series Series是一种类似与一维数组的对象,由下面两个部分组成: values:一组数据(ndarray类型) index:相关的数据索引标签 Series的创建 两种创建方式: 由列表或numpy数组创建 默认索引为0到N 1的整数型索引(隐式索引) 0 1 ...
分类:
其他好文 时间:
2019-10-17 17:55:28
阅读次数:
88
处理丢失数据 有两种丢失数据: None np.nan(NaN) 1. None None是Python自带的,其类型为python object。因此,None不能参与到任何计算中。 NoneType 2. np.nan(NaN) np.nan是浮点类型,能参与到计算中。但计算的结果总是NaN。 ...
分类:
其他好文 时间:
2019-10-17 17:26:18
阅读次数:
99
python 统计list中各个元素出现的次数利用Python字典统计利用Python的collection包下Counter的类统计利用Python的pandas包下的value_counts的类统计利用字典dict来完成统计举例: a = [1, 2, 3, 1, 1, 2]dict = {}f ...
分类:
编程语言 时间:
2019-10-17 15:29:12
阅读次数:
368
网上的有个别不对 实际敲了一下 有补充了点常用的环境IDE anaconda python3.7 在这个速查手册中,我们使用如下缩写: df:任意的Pandas DataFrame对象 s:任意的Pandas Series对象 同时我们需要做如下的引入: import pandas as pd im ...
分类:
其他好文 时间:
2019-10-17 11:57:49
阅读次数:
129
转换NOAA天气数据文件“ .fly”为Pandas DataFrame 获取数据 ftp://ftp.ncdc.noaa.gov/pub/data/ghcn/daily In [1]: In [2]: 查询站ID In [3]: 下载天气数据 In [4]: 将.fly转换为pandas Data ...
分类:
编程语言 时间:
2019-10-17 11:48:48
阅读次数:
280