一、map() import pandas as pd import numpy as np df = pd.DataFrame({'key1' : ['a', 'a', 'b', 'b', 'a'], 'key2' : ['one', 'two', 'one', 'two', 'one'], 'd ...
分类:
移动开发 时间:
2020-03-30 13:15:36
阅读次数:
97
import pandas as pd # 加载数据集 df = pd.read_csv( "http://labfile.oss.aliyuncs.com/courses/1211/car.data", header=None) # 设置列名 df.columns = ['buying', 'ma ...
分类:
其他好文 时间:
2020-03-29 19:50:09
阅读次数:
196
Pandas的对齐运算 是数据清洗的重要过程,可以按索引对齐进行运算,如果没对齐的位置则补NaN,最后也可以填充NaN Series的对齐运算 1. Series 按行、索引对齐 s1 = pd.Series(range(10, 20), index=range(10)) s2 = pd.Serie ...
分类:
其他好文 时间:
2020-03-29 19:31:40
阅读次数:
90
这回咱们用个pandas库 1.首先先看将列表存储到csv: 代码来自于:https://blog.csdn.net/weixin_43245453/article/details/90054820 import pandas as pd #a和b的长度必须保持一致,否则报错 a = [x for ...
分类:
编程语言 时间:
2020-03-29 12:58:33
阅读次数:
90
In [24]: pd.Series(range(1000), pd.date_range("20170101", periods=1000))Out[24]:2017-01-01 02017-01-02 12017-01-03 22017-01-04 32017-01-05 4 ...2019-0 ...
分类:
其他好文 时间:
2020-03-29 01:27:25
阅读次数:
82
常用的库:Numpy、Pandas、Matplotlib、Scipy等; 编辑器:IPython和Jupyter notebook(Anaconda包含); 1.Numpy:Numerical Python缩写,主要用于数值计算。 2.Pandas:数据分析的主要工具。 3.matplotlib:绘 ...
分类:
其他好文 时间:
2020-03-28 17:51:09
阅读次数:
71
跑实验需要画heatmap,使用seaborn.heatmap挺方便的,但是在刻度和标签字体设置上网上讲的不是很清楚,本文主要记录 ( x轴 / y轴 / colorbar ) 上的刻度ticks及标签label的文本设置。 python_version=2.7 数据格式用的pandas.DataF ...
分类:
其他好文 时间:
2020-03-28 13:36:33
阅读次数:
1747
数据预处理常用函数 df.duplicated() :判断各行是重复,False为非重复值。 df.drop_duplicates():删除重复行 df.fillna(0):用实数0填充na df.dropna():按行删除缺失数据,使用参数axis=0;按列删除缺失值,使用参数axis=1,how ...
分类:
其他好文 时间:
2020-03-27 17:17:54
阅读次数:
128
读取URL,匹配一个包含特殊字符的表importpandasaspdurl=‘http://fx.cmbchina.com/Hq/‘matchStr=‘交易币‘tb=pd.read_html(url,match=matchStr)print(tb)输出如下:[0123456780交易币交易币单位基本币现汇卖出价现钞卖出价现汇买入价现钞买入价时间汇率走势图1港币100
分类:
Web程序 时间:
2020-03-26 23:08:54
阅读次数:
543
import pandas as pd from sklearn.decomposition import PCA # 数据地址:https://www.kaggle.com/c/instacart-market-basket-analysis/data # 读取表 prior = pd.read_ ...
分类:
其他好文 时间:
2020-03-26 01:27:10
阅读次数:
116