码迷,mamicode.com
首页 >  
搜索关键字:缺失值    ( 264个结果
第四章 基本数据管理
4 基本数据管理4.1一个示例(创建leadership数据框)manager75]=55&age y is.na(y)[1] FALSE FALSE FALSE TRUE #检测y内是否有空值存在4.6 在分析中排除缺失值 x30),]detach(leadership)newdata #挑选性....
分类:其他好文   时间:2015-09-13 10:29:10    阅读次数:162
KNN算法的Python实现
#KNN算法思路:#-----------------------------------------------------##step1:读入数据,存储为链表#step2:数据预处理,包括缺失值处理、归一化等#step3:设置K值#step4:计算待测样本与所有样本的距离(二值、序数、连续)#step5:投票决定待测样本的类别#step6:利用测试集测试..
分类:编程语言   时间:2015-09-04 12:41:49    阅读次数:288
《R语言实战》读书笔记--第四章 基本数据管理
本章内容: 操纵日期和缺失值 熟悉数据类型的转换 变量的创建和重编码 数据集的排序,合并与取子集 选入和丢弃变量 多说一句,数据预处理的时间是最长的……确实是这样的,额。 4.1一个示例 4.2创建新变量 算术运算符:+、-、*、/、^(**)(求幂)、x %% y(取余运算)、x %/% y(整数...
分类:编程语言   时间:2015-08-11 07:05:10    阅读次数:151
R简单算术操作符<函数和+-*/>,缺失值,正则向量,向量运算<索引>(二)
赋值操作x x;assign("x", c(1,2,3));这四种形式在大部分时候都能达到一致的效果。推荐使用第一种1:向量的定义一串有序数值构成的数值向量(vector) ,创建一个向量我们使用c(num1,num2,num3);在 R 环境里面,单个的数值也是被看作长度为1的向量。 1.1 .....
分类:其他好文   时间:2015-06-05 00:12:40    阅读次数:161
【数据分析 R语言实战】学习笔记 第三章 数据预处理 (下)
3.3缺失值处理R中缺失值以NA表示,判断数据是否存在缺失值的函数有两个,最基本的函数是is.na()它可以应用于向量、数据框等多种对象,返回逻辑值。> attach(data)The following objects are masked fromdata (pos = 3):city, pri...
分类:编程语言   时间:2015-05-15 22:41:09    阅读次数:289
R语言学习笔记-统计函数
R语言中有很多有用的统计函数。例如算术平均数: mean(x) 求x的平均数。 mean(x, trim=0.05, na.rm=TRUE) 则提供了截尾平均数,即丢弃了最大5%和最小5%的数据和所有缺失值后的算术平均数。 R提供的常用统计函数: 函  数 描述 mean(x)             平均数 mean(c(1,2,3,4))...
分类:编程语言   时间:2015-05-13 12:55:20    阅读次数:191
数据分析方法汇总
一、描述统计描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率\回归法、决策树法。2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K...
分类:其他好文   时间:2015-05-12 00:02:56    阅读次数:136
机器学习--Logistic回归算法案例
案例:从疝气病症预测病马的死亡率         准备数据时,数据中的缺失值是个非常棘手的问题。因为有时候数据相当昂贵,扔掉和重新获取都是不可取的,所以必须采用一些方法来解决这个问题。         在预处理阶段需要做两件事:第一,所有的缺失值必须用一个实数值来替换,因为我们使用的NumPy数据类型不允许包含缺失值。这里选择实数0来替换所有缺失值,恰好能适用于Logistic回归。第二,如果...
分类:编程语言   时间:2015-05-08 09:41:46    阅读次数:187
kaggle数据挖掘竞赛初步--Titanic<数据变换>
缺失值填充之后,就要对其他格式有问题的属性进行处理了。比如Sex Embarked这些属性的值都是字符串类型的,而scikit learn中的模型都只能处理数值型的数据,需要将这些原始的字符串类型的数据转为数值型数据。所有数据通常可以分成两种类型:定量与定性。定量的属性(数值属性)通常蕴涵着可排序性...
分类:其他好文   时间:2015-03-20 23:44:48    阅读次数:197
【读书笔记-数据挖掘概念与技术】数据预处理
数据预处理的目的:提高数据质量,数据质量的三要素:准确性、完整性、一致性。 数据预处理的任务: 数据清理 数据集成 数据规约 数据变换 数据清理——填充缺失的值、光滑噪声、识别离群点、纠正数据中的不一致 缺失值: 忽略元组 人工填写缺失值 使用一个全局常量 使用属性的中心度量 使用与给定元组属同一类...
分类:其他好文   时间:2015-03-12 00:57:10    阅读次数:143
264条   上一页 1 ... 23 24 25 26 27 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!