码迷,mamicode.com
首页 > 其他好文 > 详细

缺失数据的处理

时间:2018-05-28 21:18:05      阅读:185      评论:0      收藏:0      [点我收藏+]

标签:pre   取值   数据处理   获取   属性   利用   数据   16px   style   

做数据分析挖掘特征之前,都要先处理好数据,数据处理里第一步我们要先处理有缺失值的情况。

查看导入的数据缺失情况:

 1 import pandas as pd
 2 from io import StringIO
 3 
 4 csv_data = """A,B,C,D
 5 1.0,2.0,3.0,4.0
 6 5.0,6.0,,8.0
 7 0.0,11.0,12.0,
 8 """
 9 df = pd.read_csv(StringIO(csv_data))
10 print(df)
11 # 输出缺失值的个数
12 missing = df.isnull().sum()
13 print(missing)
14 print(missing.values, type(missing.values))
15 print(missing.values[1:])  # 可以索引取值,但是不是列表,方法属性不一样
16 print(dir(missing.values))

  通过打印的输出我们可以发现使用 isnull方法可以判断值是否为空,isnull().sum()方法按列输出缺失值的个数。

  我们可以利用数据框(DataFrame)的values属性来获取对应的NumPy数组。

删除有缺失值的行或列:

1 print(df.dropna())  # 按行删除有缺失值
2 print(df.dropna(axis=1))  # 删除列中有缺失值的列
3 print(df.dropna(how="all"))  # 删除那些行全是缺失值的
4 print(df.dropna(thresh=4))  # 删除那些没有4个值的行
5 print(df.dropna(subset=["C"]))  # 删除缺失值出现在列标为"C"的行

 

缺失数据的处理

标签:pre   取值   数据处理   获取   属性   利用   数据   16px   style   

原文地址:https://www.cnblogs.com/dan-baishucaizi/p/9102100.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!