Mahalanobis距离是用来度量一个点P和一个分布D之间的距离,它是衡量点P与分布D的均值之间存在多少个标准差的一个多维泛化版本。
如果P就位于分布D的均值处,则该距离为0;该距离随着P的偏离均值开始逐步增大。
分类:
其他好文 时间:
2014-12-09 15:13:33
阅读次数:
177
问:为什么要去均值?1、我认为归一化的表述并不太准确,按统计的一般说法,叫标准化。数据的标准化过程是减去均值并除以标准差。而归一化仅包含除以标准差的意思或者类似做法。2、做标准化的原因是:减去均值等同于坐标的移动,把原始数据点的重心移到和原点重合,这样利于很多表达,比如数据的协方差矩阵可以写成XX'...
分类:
其他好文 时间:
2014-12-08 00:34:02
阅读次数:
303
一、统计学的基本概念统计学里最基本的概念就是样本的均值、方差、标准差。首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述:均值:标准差:方差:均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到均值的距离之平均。以这两个集合为例,[0, ...
分类:
其他好文 时间:
2014-12-06 09:58:59
阅读次数:
137
这几天在看文章的时候,看到这么一段话:“First, we normalize thegrayscale intensity in the eye region for each of the aligned facialimages to zero mean and unit variance.”...
分类:
其他好文 时间:
2014-12-05 12:09:19
阅读次数:
549
原文:【T-SQL系列】常用函数—聚合函数聚合函数平均值AVG、标准偏差STDEV、方差VAR、最大值MAX、最小值MIN、合计SUM、次数COUNT、极差值MAX-MIN、变异系数STDEV/AVG*100
什么是统计统计 就是通过样本特性推断总体特性的过程。类似于赌博,有一定的风险。可信度受取样...
分类:
数据库 时间:
2014-12-02 10:25:04
阅读次数:
535
原文:《BI项目笔记》历年感官评吸质量均值变化分析Cube的建立分析主题主要维度:烟叶级别、烟叶级别按等级信息、烟叶级别按分级标准(标准维度)产地(父子维度)检测时间(时间维度,以Tqc_Raw_SmokingTest .CheckTime字段派生CheckDate字段)样品维度
主要指标:
香气特...
分类:
其他好文 时间:
2014-12-02 10:20:24
阅读次数:
181
原文:《BI项目笔记》创建多维数据集Cube(2)本节建立:
历年的初烟水分均值变化分析Cube:区域维度:地州,专县时间维度:年等级维度:大等级,小等级指标:水分均值数据源视图: 数据处理: ALTER TABLE T_QualMoisture_Middle ALTER COLUMN V_Prod...
分类:
其他好文 时间:
2014-12-02 10:07:54
阅读次数:
212
题意:
n(3000)个点的图 q(10^4)次操作 每次操作从原图更改一条边的权值 问q次操作后最小生成树的平均值是多少
思路:
先求最小生成树 然后讨论 如果更改的不是树边 则最小生成树不变 如果是树边 就要选择原图中的非树边和更改后的这条边其中较小的一个形成新树
难做的只有“是树边”这种情况 我们考虑 原图中的非树边与原树一定可以形成一个环 那么我们可以这样理解...
分类:
其他好文 时间:
2014-11-30 12:36:12
阅读次数:
192
文件aa.txt,格式为: 时间 url 2 url1 8 url3 2 url2 3 url1 4 url3要求:在第二列url相同条件下,输出第一列最大值,第一列平均值,第二列出现相同url次数。每行输出列格式为:第一列最大值、第一列平均值、第二列出现相同url次数、url...
分类:
其他好文 时间:
2014-11-30 00:12:58
阅读次数:
888
数组
第10题
【描述】
中位数定义:一组数据按从小到大的顺序依次排列,处在中间位置的一个数或最中间两个数据的平均值(如果这组数的个数为奇数,则中位数为位于中间位置的那个数;如果这组数的个数为偶数,则中位数是位于中间位置的两个数的平均值)。
给出一组无序整数,求出中位数,如果求最中间两个数的平均数,向下取整即可(不需要使用浮点数)。
【输入】
包含多组测试数据,每一组测试数据的第一行为...
分类:
其他好文 时间:
2014-11-29 14:40:41
阅读次数:
141