我们知道线性回归模型有一些适用条件:1.线性、2.无自相关、3.残差符合正态分布、4.方差齐性。当数据无法满足这些条件时,我们要么对数据进行转换,使之符合线性回归的条件,要么对模型进行调整,使之适应原始数据。总之,这是一个数据和模型相互适应的过程。下面我们分别来介绍一下,当这四种条件不满足时的处理方
分类:
其他好文 时间:
2016-03-09 10:56:10
阅读次数:
3018
我认为这个是最好的解释,没有之一: http://tieba.baidu.com/p/3276827805 (里面公式有点错误) 卡尔曼滤波,其实就是将前面的一个测量值(代入系统变化方程)和后面的一个测量值联系起来(其实就是最优线性叠加),所以一定要知道系统变化方程。 问题在于,这两个估计的方差如何
分类:
其他好文 时间:
2016-03-06 15:40:28
阅读次数:
121
对于上一篇中的问题:X ~ N(µ, σ^2 ) , Y = sin(X)要求随机变量Y的期望和方差。还有一种思路是对X进行采样,比如取500个采样点(这些采样点可以称为sigma点),然后求取这些采样点的期望和方差。当采样值足够大时,结果与理论值接近。这种思路的问题显而易见,当随机变量维数增大时采
分类:
其他好文 时间:
2016-03-02 20:02:50
阅读次数:
272
参考其他网页 通常R2越大越好,但看到亦在后面标上P值,这两者之间有何联系? R2和p值没有必然联系。就像你做线性分析和(单因素或多因素)方差分析一样,若A和K线性相关,也有可能A对K么有显著性影响一样。p值是与ɑ(显著性水平,一般取0.05或0.01)相关的一个值,通常,在p值<0.05(0.01
分类:
其他好文 时间:
2016-03-01 22:20:59
阅读次数:
235
这是去年合肥的另一道签到。。。题目其实很简单。。。仔细想想范围就能推出来了,第一二维存位置,但显然不够,所以开第三维,由于空间限制只能在和以及平方和二选一,由于平方和太大,所以只能存和。然后dp的值如果存为方差*n的话,显然还需要一维存平方和,但仔细看看式子,如果和以及平方和知道了,也就知道方差了,
分类:
其他好文 时间:
2016-02-23 20:36:47
阅读次数:
207
降维 参考网址http://dataunion.org/20803.html 【低方差滤波 (Low Variance Filter)】需先对数据做归一化处理 【高相关滤波】认为当两列数据变化趋势相似时,它们包含的信息也相似 【随机森林】对目标属性产生许多巨大的树,然后根据对每个属性的统计结果找到信
分类:
其他好文 时间:
2016-02-18 11:32:53
阅读次数:
269
原文出处: http://blog.sina.com.cn/s/blog_c96053d60101n24f.html 在PCA算法中用到了方差,协方差矩阵,其中方差公式为,协方差矩阵公式为,当时不明白为什么除的不是m,而是m-1,那么想要知道为何,下面就是你想要的答案。 假设X为独立同分布的一组随机
分类:
其他好文 时间:
2016-02-14 06:48:17
阅读次数:
196
转载地址:http://www.cnblogs.com/jerrylead/archive/2011/04/18/2020209.html 1. 问题 真实的训练数据总是存在各种各样的问题: 1、 比如拿到一个汽车的样本,里面既有以“千米/每小时”度量的最大速度特征,也有“英里/小时”的最大速度特征
分类:
其他好文 时间:
2016-02-13 21:54:39
阅读次数:
328
题目:输入一个正数n,输出全部和为n连续正数序列。比如输入15,因为1+2+3+4+5=4+5+6=7+8=15,所以输出3个连续序列1-5、4-6和7-8。 方法一:记录序列长度。推断首项是否满足条件就可以 首先联想到的就是等差数列,并且方差为1的正数等差数列,我们仅仅须要记录一个序列长度,依据等
分类:
其他好文 时间:
2016-02-06 18:16:10
阅读次数:
149
本章介绍时间序列中的基本概念。特别地,介绍随机过程、均值、方差、协方差函数、平稳过程和自相关函数等概念。 2.1时间序列与随机过程 关于随机过程的定义,本科上过相关课程,用的是《应用随机过程》清华林元烈老师的书。第1章第5节: 上面的定义比较清楚明白。按照本书上的说法,随机变量序列就是一个随机过程,
分类:
编程语言 时间:
2016-02-05 18:52:26
阅读次数:
269