dropna默认丢失任何含有缺失值的行。 你可能希望丢弃含有NA的行或列,传输how='all'将只丢弃含有NA的行。 要用这种方式丢弃列,只需要传入axis=1即可。 另一个滤除DataFrame行的问题涉及时间序列数据,假设你只想留下一部分观测数据,可以用thresh参数实现此目的。 你可能不想 ...
分类:
其他好文 时间:
2019-06-08 18:59:24
阅读次数:
91
首先查看数据形态: 再查看数据类型和非空值的个数与比例 使用SimpleImputer进行填补 默认是用均值进行填补,参数如下: missing_values: 空值的类型。默认np.nan 注意,numpy自带的fillna只能填补np.nan,而此处则可以指定空值的类型。比如 或 strateg ...
分类:
其他好文 时间:
2019-06-07 12:46:42
阅读次数:
154
今天我们来继续讲解Python中的Pandas库的基本用法 那么我们如何使用pandas对数据进行排序操作呢? 我们对food,进行sort_values方法,会自动帮我们排序,第一个参数"Sodium_(mg)"是我们数据中的列名 意思是说,你要对哪一列数据进行排序,inplace 参数的意思是, ...
分类:
编程语言 时间:
2019-05-09 18:21:29
阅读次数:
120
一般线性回归我们用均方误差作为损失函数。损失函数的代数法表示如下: J(θ0,θ1...,θn)=∑i=0m(hθ(x0,x1,...xn)?yi)2J(θ0,θ1...,θn)=∑i=0m(hθ(x0,x1,...xn)?yi)2 进一步用矩阵形式表达损失函数: J(θ)=12(Xθ?Y)T(Xθ ...
分类:
其他好文 时间:
2019-05-08 21:34:06
阅读次数:
152
cx_oracle 使用 python 连接 oracle 统计指定表格所有字段的缺失值数 ...
分类:
数据库 时间:
2019-05-06 11:50:18
阅读次数:
139
pandas 1、基于NumPy构建 2、具备对其功能的数据结构DataFrame、Series 3、集成时间序列功能 4、提供丰富的数学运算和操作 5、灵活处理缺失数据 pip install pandas import pandas as pd Series 一维数据对象 1、Series是一种 ...
分类:
其他好文 时间:
2019-04-29 19:17:41
阅读次数:
146
内容目录 1. 统计函数 2. 窗口函数 3. 加深加强 数据准备 1.统计函数 最常见的计算工具莫过于一些统计函数了。 这里我们首先构建一个包含了用户年龄与收入的 DataFrame。我们可以通过 cov 函数来求出年龄与收入之间的协方差,计算的时候会丢弃缺失值。除了协方差之外,我们还可以通过 c ...
分类:
其他好文 时间:
2019-03-11 23:38:30
阅读次数:
252
一.缺失值 sklearn中的preprocessing下游imputer,可进官方文档参考。这里主讲pandas。 拿到数据,一般先检查是否有缺失值,用isnul()或notnull(). 再决定dropna(),还是fillna()。 1.1 检查是否有缺失值 isnull()、notnull( ...
分类:
其他好文 时间:
2019-03-07 00:52:10
阅读次数:
239
一、背景与挖掘目标 相关背景自查 二、分析方法与过程 1、EDA(探索性数据分析) 1.分布分析 2.周期性分析 2、数据预处理 1.数据清洗 过滤非居民用电数据,过滤节假日用电数据(节假日用电量明显低于工作日) 2.缺失值处理 3.数据变换 以线损指标为例,可自定义为 通过这种方式,将上面各种复杂 ...
分类:
编程语言 时间:
2019-03-01 12:54:38
阅读次数:
389
import cx_Oracle as orcl class ConnectOracle: #scott xx 192.168.32.200 1521 oracle #sqlplus, system as sysdba, select instance_name from V$instance; #... ...
分类:
数据库 时间:
2019-02-26 16:50:33
阅读次数:
384