描述性统计包含多种基本描述统计量,让用户对于数据结构可以有一个初步的认识。在此所提供之统计量包含: 用户可选择多个变量同时进行计算,亦可选择分组变量进行多组别的统计量计算。 例如: 中位数描述数据中心位置的数字特征。大体上比中位数大或小的数据个数为整个数据的一半。对于对称分布的数据,均值与中位数比较
分类:
编程语言 时间:
2016-03-14 21:42:47
阅读次数:
1290
1、安装 2、 样本数目 总共发送到服务器的请求数。 最新样本 代表时间的数字,是服务器响应最后一个请求的时间 吞吐量 是服务器每分钟处理的请求数。 平均值 是总运行时间除以发送到服务器的请求数。 中间值 是代表时间的数字,有一半的服务器响应时间低于该值而另一半高于该值。 偏离 表示
分类:
其他好文 时间:
2016-03-14 11:58:43
阅读次数:
227
软件工作量的估计方法有哪些? 答: DELPHI方法:先成立专家估计小组,然后由每位专家独立估计,之后收集各专家的估计结果记录最大值、最小值、平均值、差异率以及是否接受。对于存在不同意见的结果进行多轮估计,最后由专家们讨论得出结论。 模型法:一元线性关系:工作量=规模/生产率+C
分类:
其他好文 时间:
2016-03-13 00:48:02
阅读次数:
124
1.1算法流程 假设有m个samples,每个数据有n维。 1. 计算各个feature的平均值,计μj ;(Xj(i)表示第i个样本的第j维特征的value) μj = Σm Xj(i)/m meanVals = mean(dataMat, axis=0) 2. 将每一个feature scali...
分类:
其他好文 时间:
2016-03-11 10:24:30
阅读次数:
233
1、kmeans算法 1.1Kmeans算法理论基础 K均值算法能够使聚类域中所有样品到聚类中心距离平方和最小。其原理为:先取k个初始聚类中心,计算每个样品到这k个中心的距离,找出最小距离,把样品归入最近的聚类中心,修改中心点的值为本类所有样品的均值,再计算各个样品到新的聚类中心的距离,重新归类,修...
分类:
编程语言 时间:
2016-03-10 20:22:10
阅读次数:
571
#coding:utf-8
import math
import copy
import numpy as np
import matplotlib.pyplot as pltisdebug = True#指定k个高斯分布参数,这里指定k=2。
#注意2个高斯分布具有相同方差Sigma,均值分别为Mu1,Mu2。
#共1000个数据#生成训练样本,输入6,40,20,2
#两类样本方差为6,
#...
分类:
编程语言 时间:
2016-03-10 17:30:42
阅读次数:
324
EM算法的基本思想
极大似然估计–示例
极大似然估计步骤
极大似然估计求解
EM算法
EM算法步骤
EM算法推导
EM算法的高斯混合模型应用
高斯混合模型参数估计的EM算法
E步
M步
两个模型均值估计结果...
分类:
编程语言 时间:
2016-03-10 17:27:53
阅读次数:
213
知乎上看到的 - 收集高质量标注数据 - 输入输出数据做好归一化,以防出现数值问题,方法就是主成分分析啥的。- 参数初始化很重要。太小了,参数根本走不动。一般权重参数0.01均方差,0均值的高斯分布是万能的,不行就试更大的。偏差参数全0即可。- 用SGD ,minibatch size 128。或者
分类:
其他好文 时间:
2016-03-09 10:57:06
阅读次数:
166
本题要求实现一个函数,求N个集合元素S[]的平均值,其中集合元素的类型为自定义的ElementType。 函数接口定义: ElementType Average( ElementType S[], int N ); 其中给定集合元素存放在数组S[]中,正整数N是数组元素个数。该函数须返回N个S[]元
分类:
其他好文 时间:
2016-03-07 01:22:00
阅读次数:
194
一vmstat更多请到http://www.07net02.com查阅vmstat命令报告关于内核线程、虚拟内存、磁盘、陷阱和CPU活动的统计信息。由vmstat命令生成的报告可以用于平衡系统负载活动。系统范围内的这些统计信息(所有的处理器中)都计算出以百分比表示的平均值,或者计算其总和。vmstat可以..
分类:
系统相关 时间:
2016-03-05 14:53:57
阅读次数:
217