作者:Spark链接:https://www.zhihu.com/question/37069477/answer/132387124来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 在回归问题和一些机器学习算法中,以及训练神经网络的过程中,通常需要对原始数据进行中心化 ...
分类:
其他好文 时间:
2017-07-06 16:51:52
阅读次数:
1109
数据归一化 数据的标准化是将数据按比例缩放,使之落入一个小的特定区间,一般为0到1之间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。 常见的数据归一化的方法有: 1.min-max标准化(离差标准化) 是对原始数据 ...
分类:
其他好文 时间:
2017-06-29 23:48:33
阅读次数:
244
样本服从正态分布,证明样本容量n乘样本方差与总体方差之比服从卡方分布x^2(n) 正态分布的n阶中心矩参见: http://www.doc88.com/p-334742692198.html ...
分类:
其他好文 时间:
2017-06-23 22:02:20
阅读次数:
837
摘自:https://www.zhihu.com/question/27976634 简单说一下为什么要用EM算法 现在一个班里有50个男生,50个女生,且男生站左,女生站右。我们假定男生的身高服从正态分布 ,女生的身高则服从另一个正态分布: 。这时候我们可以用极大似然法(MLE),分别通过这50个 ...
分类:
编程语言 时间:
2017-06-20 18:02:46
阅读次数:
130
1.通常神经认知机包含两类神经元,即承担特征抽取的S-元和抗变形的C-元。S-元中涉及两个重要参数,即感受野与阈值参数,前者确定输入连接的数目,后者则控制对特征子模式的反应程度。在传统的神经认知机中,每个S-元的感光区中由C-元带来的视觉模糊量呈正态分布,也就是说如果眼睛感受到物体是移动的,即已感受 ...
分类:
其他好文 时间:
2017-06-15 21:41:00
阅读次数:
434
Ref: https://onlinecourses.science.psu.edu/stat464/print/book/export/html/5 Two sample test 直接使用R的t-test t.test(n, t, alternative="two.sided", var.equ ...
分类:
移动开发 时间:
2017-06-07 11:16:22
阅读次数:
179
参考网址: https://onlinecourses.science.psu.edu/stat464/node/2 Binomial Distribution Normal Distribution 将正态分布标准化。这也就是Z-score Confidence Interval 在上面的前提下, ...
分类:
移动开发 时间:
2017-06-06 11:59:48
阅读次数:
250
模型已定,参数未知 最大似然估计提供了一种给定观察数据来评估模型参数的方法,假设我们要统计全国人口的身高,首先假设这个身高服从服从正态分布,但是该分布的均值与方差未知。我们没有人力与物力去统计全国每个人的身高,但是可以通过采样,获取部分人的身高,然后通过最大似然估计来获取上述假设中的正态分布的均值与 ...
分类:
其他好文 时间:
2017-06-02 22:55:56
阅读次数:
322
神说,要有正态分布,就有了正态分布。神看正态分布是好的,就让随机误差服从了正态分布。创世纪—数理统计 1. 正态分布,熟悉的陌生人 学过基础统计学的同学大都对正态分布非常熟悉。这个钟形的分布曲线不但形状优雅,它对应的密度函数写成数学表达式 f(x)=12π??√σe?(x?μ)22σ2 也非常具有数 ...
分类:
其他好文 时间:
2017-06-01 19:41:51
阅读次数:
214
1.最小二乘法 注:这里假定你了解向量的求导公式,并且知道正态分布和中心极限定律(不知道的可以去数学知识索引翻翻) (线性)最小二乘回归解法: 损失函数:平方损失,这里的误差可能是多种独立因素加和造成的,所以我们假定其符合均值为0的高斯分布,继而可以推出平方损失。参考Andrew Ng机器学习公开课 ...
分类:
其他好文 时间:
2017-06-01 10:35:58
阅读次数:
255