变量:连续变量、有序分类变量 和 无序分类变量 一、连续变量和连续变量 1、若连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,就是效率没有pearson相关系数高。 2、若连续数据不满足正态分布,可采用对数转换等方法将数据转换成正态分布。 3、上 ...
分类:
其他好文 时间:
2017-02-15 22:09:55
阅读次数:
453
假设检验分参数假设和非参数假设。 假设 先假设原假设H0,对应的反面叫做备择假设H1。SAS一般沿用的规则是NEYMAN和PEARSON提出的:在控制犯第一类错误的原则下,是犯第二类错误的概率尽量小(即,原假设受到保护,不能轻易否定。若原假设被否定了,其理由一定是充分的)。反过来思考,若为了是假设更 ...
分类:
其他好文 时间:
2017-02-13 23:58:40
阅读次数:
489
A.txt A1 10.5318295 10.99222177 11.03562467 10.96557789 10.83035429A2 6.739434821 7.116196513 6.580855876 6.373403461 6.171394699A3 8.211470461 7.4081 ...
分类:
其他好文 时间:
2016-12-29 11:04:23
阅读次数:
202
mean均值,variance方差,stddev标准差,corr(Pearson相关系数),skewness偏度,kurtosis峰度 ...
分类:
其他好文 时间:
2016-11-25 20:00:48
阅读次数:
153
1. Find correlations for each type of data by using corr() correlations = combined.corr(method = "pearson") print(correlations["sat_score"]) note: The ...
分类:
其他好文 时间:
2016-10-23 12:10:18
阅读次数:
207
先说独立与相关的关系:对于两个随机变量,独立一定不相关,不相关不一定独立。有这么一种直观的解释(不一定非常准确):独立代表两个随机变量之间没有任何关系,而相关仅仅是指二者之间没有线性关系,所以不难推出以上结论。 衡量随机变量相关性的方法主要有三种:pearson相关系数,spearman相关系数,k ...
分类:
其他好文 时间:
2016-09-30 02:26:33
阅读次数:
206
皮尔逊相关系数 维基百科定义:两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商 余弦相似性 皮尔逊相关系数与余弦相似性的关系 皮尔逊相关系数就是减去平均值(中心化)后做余弦相似性 ...
分类:
其他好文 时间:
2016-08-25 20:58:38
阅读次数:
168
同样可参考: http://blog.csdn.net/wsywl/article/details/5889419 转自:https://www.douban.com/note/267043565/ 测量相关程度的相关系数很多,各种参数的计算方法及特点各异。 连续变量的相关指标: 此时一般用积差相关 ...
分类:
其他好文 时间:
2016-08-23 01:13:29
阅读次数:
196
1.重要的统计量 2.协方差 3.Pearson相关系数 4.协方差矩阵 5.相关系数矩阵 用来发现特征的相关性 6.独立与不相关 7.矩 8.重要的定理与不等式 ①Jenson不等式 ②切比雪夫不等式 ③大数定理 ④伯努利定理 ⑤中心极限定理 9.参数估计 ①矩估计 ②极大似然估计 ...
分类:
其他好文 时间:
2016-07-19 22:09:45
阅读次数:
118
#coding=utf-8 from math import sqrt from loadMovieLens import loadMovieLensTrain from loadMovieLens import loadMovieLensTest ### 计算pearson相关度 def sim_... ...
分类:
其他好文 时间:
2016-07-13 13:33:47
阅读次数:
158