码迷,mamicode.com
首页 >  
搜索关键字:协方差 相关系数    ( 506个结果
《BI那点儿事》双变量的相关分析——相关系数
例如,“三国人物是否智力越高,政治就越高”,或是“是否武力越高,统率也越高;准备数据分析环境:SELECT *FROM FactSanguo11WHERE 姓名 IN ( N'荀彧', N'荀攸', N'贾诩', N'程昱', N'郭嘉' )曹魏五谋臣,指荀彧、荀攸、贾诩、程昱、郭嘉五人...
分类:其他好文   时间:2014-12-18 20:22:50    阅读次数:293
R语言与数据分析之五:主成分分析
主成份分析历史: Pearson于1901年提出,再由Hotelling(1933)加以发展的一种多变量统计方法。通过析取主成分显出最大的个别差异,也用来削减回归分析和聚类分析中变量的数目,可以使用样本协方差矩阵或相关系数矩阵作为出发点进行分析。 通过对原始变量进行线性组合,得到优化的指标:把原先多个指标的计算降维为少量几个经过优化指标的计算(占去绝大部分份额) 基本思想:设法将原先众多具有...
分类:编程语言   时间:2014-12-15 10:29:54    阅读次数:290
协方差矩阵
原文链接自从上次谈了协方差矩阵之后,感觉写这种科普性文章还不错,那我就再谈一把协方差矩阵吧。上次那篇文章在理论层次介绍了下协方差矩阵,没准很多人觉得这东西用处不大,其实协方差矩阵在好多学科里都有很重要的作用,比如多维的正态分布,再比如今天我们今天的主角——主成分分析(Principal Compon...
分类:其他好文   时间:2014-12-13 23:18:59    阅读次数:265
相关性分析方法(Pearson、Spearman)
有时候我们根据需要要研究数据集中某些属性和指定属性的相关性,显然我们可以使用一般的统计学方法解决这个问题,下面简单介绍两种相关性分析方法,不细说具体的方法的过程和原理,只是简单的做个介绍,由于理解可能不是很深刻,望大家谅解。1、Pearson相关系数 最常用的相关系数,又称积差相关系数,取值-...
分类:其他好文   时间:2014-12-11 22:20:19    阅读次数:686
主成分分析法(PCA)答疑
问:为什么要去均值?1、我认为归一化的表述并不太准确,按统计的一般说法,叫标准化。数据的标准化过程是减去均值并除以标准差。而归一化仅包含除以标准差的意思或者类似做法。2、做标准化的原因是:减去均值等同于坐标的移动,把原始数据点的重心移到和原点重合,这样利于很多表达,比如数据的协方差矩阵可以写成XX'...
分类:其他好文   时间:2014-12-08 00:34:02    阅读次数:303
PCA学习总结
1. PCA整体思想PCA,Principle Componet Analysis,主成分分析,主要用于数据降维。它通过计算给定数据集的协方差矩阵的特征值和特征向量,来得到数据集最关键的方向(数据集在此方向的投影方差最大,这个能保持最多的信息),并从关键的方向中选取前k个构成k维空间,在此空间中重新...
分类:其他好文   时间:2014-12-07 06:28:10    阅读次数:171
协方差矩阵
一、统计学的基本概念统计学里最基本的概念就是样本的均值、方差、标准差。首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述:均值:标准差:方差:均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到均值的距离之平均。以这两个集合为例,[0, ...
分类:其他好文   时间:2014-12-06 09:58:59    阅读次数:137
hadoop Mahout中相似度计算方法介绍(转)
来自:http://blog.csdn.net/samxx8/article/details/7691868相似距离(距离越小值越大) 优点 缺点 取值范围 PearsonCorrelation 类似于计算两个矩阵的协方差 ...
分类:其他好文   时间:2014-12-04 11:44:06    阅读次数:281
【读书笔记】《推荐系统(recommender systems An introduction)》第二章 协同过滤推荐
输入:“用户—物品”评分矩阵 输出:(1)用户对某个物品喜欢程度的评分;(2)对于用户,n个推荐的物品列表 1. 基于用户的最近邻推荐(user-based cf) 算法基本假设:(1)如果用户过去有相似的偏好,那么他们未来也会有相似的偏好;(2)用户的偏好不随时间变化而变化 用户相似度计算:user-based cf中pearson相关系数比较好;item-bas...
分类:其他好文   时间:2014-12-03 00:25:30    阅读次数:206
【转】机器学习问题方法总结
机器学习问题方法总结大类名称关键词有监督分类决策树信息增益分类回归树Gini指数,Χ2统计量,剪枝朴素贝叶斯非参数估计,贝叶斯估计线性判别分析Fishre判别,特征向量求解K最邻近相似度度量:欧氏距离、街区距离、编辑距离、向量夹角、Pearson相关系数逻辑斯谛回归(二值分类)参数估计(极大似然估计...
分类:其他好文   时间:2014-11-27 12:34:58    阅读次数:369
506条   上一页 1 ... 44 45 46 47 48 ... 51 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!