结果: 分析: 皮尔逊相关系数(corrcoef)运算速度远超DTW或FASTDTW,但DTW或FASTDTW应用范围更广,适用于等长或变长的比较。 ...
分类:
编程语言 时间:
2018-12-06 22:17:00
阅读次数:
237
%金融数据分析导论—基于R语言 基础理论: 1、在时间序列分析中,统计推断的基础是弱平稳性的概念。 %P30 2、一个弱平稳时间序列是序列前后不相关的(例如股票收益率没有显著的前后相关性这个原假设),充要条件,对所有的k>0,自相关系数=0。 %P34-35 3、资本资产定价模型(Capital A ...
分类:
其他好文 时间:
2018-12-02 13:39:46
阅读次数:
423
由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出, 表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。 ...
分类:
其他好文 时间:
2018-11-26 13:33:03
阅读次数:
302
1. 连续型特征的常用的归一化方法、离散型特征one-hot编码的意义 2. 度量特征之间的相关性 :余弦相似度和皮尔逊相关系数 ...
分类:
其他好文 时间:
2018-11-19 21:38:22
阅读次数:
480
资源链接:https://pan.baidu.com/s/1Hlc5r3qcJs7R11Q0bGABLg《程序员的数学》讲解了二进制计数法、逻辑、余数、排列组合、递归、指数爆炸、不可解问题等许多与编程密切相关的数学方法,分析了哥尼斯堡七桥问题、高斯求和方法、汉诺塔、斐波那契数列等经典问题和算法。《程序员的数学2:概率统计》涉及随机变量、贝叶斯公式、离散值和连续值的概率分布、协方差矩阵、多元正态分布
分类:
其他好文 时间:
2018-11-18 23:48:11
阅读次数:
737
资源链接:https://pan.baidu.com/s/1Hlc5r3qcJs7R11Q0bGABLg《程序员的数学》讲解了二进制计数法、逻辑、余数、排列组合、递归、指数爆炸、不可解问题等许多与编程密切相关的数学方法,分析了哥尼斯堡七桥问题、高斯求和方法、汉诺塔、斐波那契数列等经典问题和算法。《程序员的数学2:概率统计》涉及随机变量、贝叶斯公式、离散值和连续值的概率分布、协方差矩阵、多元正态分布
分类:
其他好文 时间:
2018-11-18 23:45:47
阅读次数:
259
数据降维 分类 + PCA(主成分分析降维) + 相关系数降维 PCA 降维(不常用) 实现思路 + 对数据进行 标准化 + 计算出数据的 相关系数矩阵 (是方阵, 维度是nxn, n是特征的数量) + 计算出 相关系数矩阵 的特征值和特征向量(虽然这里说的是向量, 但是是矩阵, 这个矩阵的每一列都 ...
分类:
其他好文 时间:
2018-11-17 00:26:43
阅读次数:
260
pandas 中df 对象自带相关性计算方法corr() , 可以用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数、Kendall Tau相关系数和spearman秩相关)。 >>> import numpy as np>>> import pandas as pd ...
分类:
编程语言 时间:
2018-11-15 16:12:37
阅读次数:
561
凭借记忆和百度复习一下以前学的,不断更 1:统计学三大分布,呵呵,没有正态,F,T,卡方分布 F分布(F检验)用来检验方差齐性,可用直方图和p-p图来检验(spss/R),如果方差随自变量x变大而变大,说明方差不齐,各个样本的数据可能不是来自一个整体, 比如汽车拥有量,大城市的样本多,小城市样本少, ...
分类:
其他好文 时间:
2018-11-14 15:32:49
阅读次数:
253
上图讲述的两组数据,可以看到左图的数据离散度比较大,相关性比较弱,右图数据的相关性比较强;我们在使用PCA的时候,就是要将相关性强的数据进行降维,以减少处理的数据量。 那么怎么描述数据的相关性呢?使用期望,协方差以及相关系数:下面分别是左图和右图的数字特征: 其实其关键性做得是R,R说明了点间的相关... ...
分类:
其他好文 时间:
2018-11-11 23:24:41
阅读次数:
206