码迷,mamicode.com
首页 > 编程语言 > 详细

python中dataframe常见操作:取行、列、切片、统计特征值

时间:2020-01-16 19:09:22      阅读:100      评论:0      收藏:0      [点我收藏+]

标签:href   http   range   port   lan   数字   显示   size   data   

mport numpy as np
import pandas as pd
# iloc 主要用于索引取值

df = pd.DataFrame(np.arange(20).reshape(5, 4), index=list(‘ABCDE‘), columns=list(‘wxyz‘))
print(df)
# 取指定行
print(df.head(2))
print(df[1:2])
print(df.tail(4))

# 统计列数
print(df.columns.size)

# 统计数据行数
print(len(df))

# 打印行名
print(df.index)

# 打印列名
print(df.columns)

# 指定行数
print(df.describe().iloc[3])

# 指定某列
print(df[‘z‘])

# 指定某行
print(df.loc[‘C‘])

# 切片所有行,指定列
print(df.loc[:,[‘x‘,‘y‘]])

# 切片指定行,指定列
print(df.loc[[‘A‘,‘D‘],[‘w‘,‘z‘]])

# 连续切片 iloc 不连续用loc
print(df.iloc[2:4,2:4])

# 根据数字比较 只打印大于2的数字
print(df[df>2])

# 根据列名比较 只打印大于2的行数
print(df[df.x>5])

# 复制数组
df2 = df.copy()
print(df2)

#表显示满足条件:指定列x中的值包含‘5‘和‘13‘的所有行
print(df2[df2[‘x‘].isin([‘5‘,‘13‘])])

# 计算列平均值
print(df.mean())

# 计算指定列中数字出现的个数
print(df[‘x‘].value_counts())

转:https://blog.csdn.net/tanlangqie/article/details/78656588

python中dataframe常见操作:取行、列、切片、统计特征值

标签:href   http   range   port   lan   数字   显示   size   data   

原文地址:https://www.cnblogs.com/ffli/p/12202302.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!