码迷,mamicode.com
首页 >  
搜索关键字:统计学    ( 1325个结果
【数据分析 R语言实战】学习笔记 第十一章 对应分析
11.2对应分析在很多情况下,我们所关心的不仅仅是行或列变量本身,而是行变量和列变量的相互关系,这就是因子分析等方法无法解释的了。1970年法国统计学家J.P.Benzenci提出对应分析,也称关联分析、R-Q型因子分析,其是一种多元相依变量统计分析技术。它通过分析由定性变量构成的交互汇总表,来揭示...
分类:编程语言   时间:2015-07-01 15:33:02    阅读次数:422
深度学习之神经网络与支持向量机
从人人上转过来的 前言:本文翻译自deeplearning网站,主要综述了一些论文、算法已经工具箱。 ? 引言:神经网络(Neural?Network)与支持向量机(Support?Vector?Machines,SVM)是统计学习的代表方法。可以认...
分类:其他好文   时间:2015-06-29 10:19:47    阅读次数:167
Hoeffding连接到机器学习
统计学场景:一个罐子中有红球和绿球,红球比例$v$未知,数量未知,如何得到红球比例?方法---随机抽样N个球,在其中红球占比为$u$由hoeffding可以知道:$P(|u-v|>\epsilon)\leq 2e^{-2\epsilon^2N}$对应到机器学习分类问题:目标函数为$f(x)$,现要估...
分类:其他好文   时间:2015-06-28 17:01:03    阅读次数:103
随笔(一)
最近几个月一直处于非常忙碌的状态,每天都像是无头苍蝇一样,东学学,西学学,虽然学了很多东西,但大部分都是浅尝辄止,不够深入。这次这个随笔,一半是为了宣泄一下自己的情绪,一半是为了为之后几个月的学习制定一下目标。统计学基础:将各种统计学方法总结下来。参数估计、非参数估计、假设检验、方差分析、卡方检.....
分类:其他好文   时间:2015-06-28 15:20:43    阅读次数:153
机器学习课程2-笔记
课程2课程2 归纳 回归就是变量之间的关系 相关系数 RSS 线性回归通过R语言 多元线性模型 虚拟变量哑变量 多元线性回归模型 回归诊断 广义线性模型一元以及多元的线性回归,统计学东西比较多,统计学术语一堆堆的 《大数据的统计学基础》基础的基础 logistic回归,划入广义线性回归模型。 变量筛选,从一堆变量中求解出来,以及降维。 1.归纳拟合,一般选择直线或者次数比较低得曲线。(测试有误差,曲...
分类:其他好文   时间:2015-06-26 13:04:58    阅读次数:263
VC维
vc理论(Vapnik–Chervonenkis theory )是由 Vladimir Vapnik 和 Alexey Chervonenkis发明的。该理论试图从统计学的角度解释学习的过程。而VC维是VC理论中一个很重要的部分。 定义:对一个指示函数集,如果存在h个样本能够被函数集中的函数...
分类:其他好文   时间:2015-06-24 18:11:00    阅读次数:156
EM算法
《统计学习方法》第9章 EM算法及其推广 EM算法是一种迭代算法,用于含有隐含变量(hidden variable)的概率模型参数的极大似然估计,或极大后验概率估计。 EM算法的每次迭代由两步组成: E步,求期望(expectation); M步,求极大(maximization)。 所以这一算法成...
分类:编程语言   时间:2015-06-24 16:00:38    阅读次数:194
ZH奶酪:标准偏差
标准偏差 标准偏差(Std Dev,Standard Deviation) -统计学名词。一种量度数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,反之亦然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。 标准差也被称为标准偏差,或者实验标准...
分类:其他好文   时间:2015-06-24 12:34:11    阅读次数:120
易经初学体会
易经初学体会 易经的占卜过程像是在做游戏,会让人对本来崇拜的神秘易经产生怀疑, 其实易经的占卜的推导过程是有科学依据的,是在长期实践和科学验算的过程中总结的公式,是古人对统计学的运用和总结,就像我们很难怀疑数学公式一样,真正的占卜高手是要结合经验和实际情况,抓住重要因素,运用爻变卦变,物极必反的易....
分类:其他好文   时间:2015-06-24 01:59:52    阅读次数:113
数据挖掘十大算法之贝叶斯分类算法
贝叶斯分类算法是统计学的一种分类方法,它是一类利用概率统计知识进行分类的算法。在许多场合,朴素贝叶斯(Naïve Bayes,NB)分类算法可以与决策树和神经网络分类算法相媲美,该算法能运用到大型数据库中,而且方法简单、分类准确率高、速度快。 由于贝叶斯定理假设一个属性值对给定类的影响独立于其它属性的值,而此假设在实际情况中经常是不成立的,因此其分类准确率可能会下降。为此,就衍生出许多降低独立性假设的贝叶斯分类算法,如TAN(tree augmented Bayes network)算法。...
分类:编程语言   时间:2015-06-23 00:54:23    阅读次数:1514
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!