文件读取 import pandas as pd import matplotlib.pyplot as plt import numpy as np %matplotlib inline #由于数据太多,只读取前1000行 data = pd.read_csv("creditcard.csv",n ...
分类:
其他好文 时间:
2020-07-04 20:32:07
阅读次数:
98
索引 import pandas as pd ser=pd.Series(range(0,10,2)) print(ser) 0 0 1 2 2 4 3 6 4 8 dtype: int64 通过索引值或索引标签获取数据 通过index查看索引值 print(ser.index) RangeInde ...
分类:
其他好文 时间:
2020-07-04 16:56:12
阅读次数:
240
一、时间模块:datetime datetime模块,主要掌握:datetime.date(), datetime.datetime(), datetime.timedelta(),日期解析方法:parser.parse 1.datetime.date:date对象 import datetime ...
分类:
其他好文 时间:
2020-07-04 16:49:43
阅读次数:
69
df.replace(to_place='',value='',inplace=)df.replace(to_replace='浪漫情侣',value='情侣') 1 香港碧荟酒店(The BEACON) 商务出行 香港 油尖旺 九龙旺角洗衣街88号 4.7 328 747.0 2 香港湾仔帝盛酒店 ...
分类:
其他好文 时间:
2020-07-04 13:27:09
阅读次数:
72
df = pd.read_excel('titanic.xlsx',nrows=111,dtype={'价格':np.float},skiprows=13,index_col=0)nrows:选取前面多少条dtype:改变某一列类型skiprows:跳过前面多少行index_col:将第一列设置位索 ...
分类:
其他好文 时间:
2020-07-03 23:07:50
阅读次数:
81
安装pandas 通过python pip安装pandas pip install pandas pandas数据结构 pandas常用数据结构包括:Series和DataFrame Series Series是一种一维的数组型对象,包含一个值序列(与numpy中的数据类型相似),数据标签(称为索引 ...
分类:
其他好文 时间:
2020-07-03 21:45:40
阅读次数:
55
背景:dataFrame的数据,想对某一个列做逻辑处理,生成新的列,或覆盖原有列的值 下面例子中的df均为pandas.DataFrame()的数据 1、增加新列,或更改某列的值 df["列名"]=值 如果值为固定的一个值,则dataFrame中该列所有值均为这个数据 2、处理某列 df["列名"] ...
分类:
其他好文 时间:
2020-07-03 19:39:59
阅读次数:
299
1.数据分析概要 基础概念,matplotlib,numpy,pandas 2.为什么要学习数据分析? 对大量的数据进行统计分析,总结我们感兴趣的规律,用于生产。 从一堆数据中寻找经验规律 岗位需求,python数据科学的基础,机器学习课程的基础 3.什么是数据分析 数据分析是用适当的方法对手机来的 ...
分类:
其他好文 时间:
2020-07-03 10:54:36
阅读次数:
82
pandas、spark计算相关性系数速度对比 相关性计算有三种算法:pearson、spearman,kenall。 在pandas库中,对一个Dataframe,可以直接计算这三个算法的相关系数correlation,方法为:data.corr() 底层是依赖scipy库的算法。 为了提升计算速 ...
分类:
其他好文 时间:
2020-07-02 16:38:40
阅读次数:
126
from pandas import Series; #定义,可以混合定义 x = Series(['a', True, 1], index=['first', 'second', 'third']); x = Series(['a', True, 1]); #追加一个序列 n = Series([ ...
分类:
其他好文 时间:
2020-07-01 23:51:23
阅读次数:
49