标准化和缺失值的处理 标准化 : 特点 : 通过对原始数据进行变换把数据变换到均值为0, 标准差为1的范围内. ## 对于归一化来说:如果出现异常点,影响了大值和小值,那么结果显然会发生改变 对于标准化来说:如果出现异常点,由于具有一定数据量,少量的异常点对于平均值的影响并不大,从 而方差改变较小。 ...
分类:
其他好文 时间:
2019-12-01 00:18:36
阅读次数:
296
本文采用 正规方程 、 梯度下降 、 带有正则化的岭回归 三种方法对BOSTON房价数据集进行分析预测,比较三种方法之间的差异 正规方程求解方式回归系数 [[ 0.10843933 0.13470414 0.00828142 0.08736748 0.2274728 0.25791114 0.018 ...
分类:
其他好文 时间:
2019-11-27 23:11:20
阅读次数:
155
单变量线性回归(Linear Regression with One Variable) 什么是线性回归?线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法(取自 百度百科)。 例如:现在有一堆散乱的点,想找出一个一元一次方程来让这些点的分布误差最小(就 ...
分类:
系统相关 时间:
2019-11-25 15:34:48
阅读次数:
93
回归分析好久都没有了解了。下面再复习下。 **1.波士顿房产数据(完整)**通过如下代码即可获取所有数据 ``` from sklearn.datasets import load_boston boston = load_boston() print (boston.DESCR) ``` 波士顿房 ...
分类:
其他好文 时间:
2019-11-24 12:17:41
阅读次数:
80
rm(list = ls()) library(car) library(MASS) library(openxlsx) A = read.xlsx("data141.xlsx") head(A) fm = lm(y~x1+x2+x3+x4 , data=A ) #判断多重共线性 vif(fm) >... ...
分类:
其他好文 时间:
2019-11-03 01:42:08
阅读次数:
94
> vif(fm) #查看模型是否存在共线性 x1 x2 x3 21.631451 21.894402 1.334751 结果显示存在共线性 结果: > summary(fm) Call:lm(formula = y ~ x1 + x2 + x3, data = A) Residuals: Min ...
分类:
其他好文 时间:
2019-11-03 00:55:50
阅读次数:
176
从残差图中看出来,方差不齐 从图像中看出,λ可取0,即进行对数变换 ...
分类:
其他好文 时间:
2019-10-29 23:30:38
阅读次数:
117
一、支持向量机 (SVM)算法的原理 支持向量机(Support Vector Machine,常简称为SVM)是一种监督式学习的方法,可广泛地应用于统计分类以及回归分析。它是将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面,分隔 ...
分类:
编程语言 时间:
2019-10-29 21:18:55
阅读次数:
643
回归分析: 对于连续型变量使用回归分析,对于离散型变量使用方差分析。取均值之后误差便消失了,因为误差服从均值为零的正态分布。 确定性关系是指函数关系,而不确定性关系可以用函数+误差值的形式表达出来,相关关系是一种不确定关系。 相关系数可以用于去掉量纲。 只用来描述线性关系,如果原来数据不是线性关系, ...
分类:
其他好文 时间:
2019-10-22 22:13:51
阅读次数:
103
求λ的第一种方法,用包 根据box-cox指令画出来的图,λ=0.5包含在区间中,于是令λ=0.5 求λ的第二种方法 (1)对给定的λ,计算z(λ) (2)求残差平方和 (3)对一系列的λ值,重复上述步骤,得到响应的残差平方和。以λ为横轴,残差平方和为纵轴,做出响应的曲线,值观看出使得残差平方和最小 ...
分类:
其他好文 时间:
2019-10-22 12:57:46
阅读次数:
109