mpstat是linux一款实时系统监控工具。其报告与CPU的一些统计信息,这些信息存放在/proc/stat文件中。在多CPU系统里,其不但能查看所有CPU的平均状况信息,而且能够查看特定CPU的信息。mpstat最大的特点是:可以查看多核心cpu中每个计算核心的统计数据;而类似工具vmsta.....
分类:
系统相关 时间:
2015-05-16 16:15:02
阅读次数:
182
数据挖掘中的高斯分布高斯分布,无论是单变量还是多元变量,在统计数据挖掘中是非常有用的,包括一些底层数据假设是高度非高斯的数据挖掘模型。我们需要好好了解多元高斯。为什么我们应该关注它
高斯像橘子汁和阳光一样是自然存在的
我们需要它来理解贝叶斯最优分类器
我们需要它来理解回归
我们需要它来理解神经网络
我们需要它来理解混合模型
……
PDF(概率密度函数)的熵
分布的熵越大,预测就越困难,压缩就越困难...
分类:
其他好文 时间:
2015-05-13 19:56:26
阅读次数:
336
近几年移动互联网飞速发展,PC端流量已经慢慢往移动端流量转移,移动互联趋势锐不可当,各种不同互联网类型企业已经为移动端专门开辟独立部门运营。相比于PC端如:2B,B2C,第三方平台(天猫,淘宝)等,移动app的用户群体更加庞大,也更有潜力。根据统计数据,到2015年,中国互..
分类:
移动开发 时间:
2015-05-10 01:13:33
阅读次数:
153
在 ArcGIS Spatial Analyst 扩展模块中,多元分析工具集提供了用于监督分类和非监督分类的工具。影像分类工具条提供了一个用户友好的环境,可创建监督分类中使用的训练样本和特征文件。最大似然法分类工具是主要的分类方法。识别类别及其统计数据的特征文件是此工具的必需输入。...
分类:
其他好文 时间:
2015-05-08 14:58:25
阅读次数:
166
在监督分类中,需创建训练样本来表示类。在多维属性空间中,不同的类应相互隔开。如果某些类互相重叠,可考虑将重叠的类合并为一个类。为检查训练样本的分离程度和分布情况,训练样本管理器 提供了三种评估工具:直方图 窗口、散点图 窗口和统计数据 窗口。可通过管理器上的按钮访问这些工具。...
分类:
其他好文 时间:
2015-05-07 18:54:16
阅读次数:
163
最近读SVM,数学证明中用到了fisher一致性。 定义: 假设有一组统计数据X1,...,Xn,每个数据都满足一个累计分布FΘ,其中Θ是未知的。如果基于样本的对Θ的估计值可以表示为一个经验分布公式 如果估计值具有如下性质,则认为其具有Fisher一致性:
分类:
其他好文 时间:
2015-05-06 13:05:26
阅读次数:
193
最近开始学习使用mapreduce统计hbase中的数据,并将结果集存入mysql中,供前台查询使用。使用hadoop版本为2.5.1,hbase版本为0.98.6.1mapreduce程序分为三个部分:job、map函数、reduce函数job类: 1 public class DayFaultS...
分类:
数据库 时间:
2015-05-05 16:11:24
阅读次数:
373
MVC开始是存在于桌面程序中的,M是指业务模型,V是指用户界面,C则是控制器 使用MVC的目的是将M和V的实现代码分离,从而使同一个程序可以使用不同的表现形式。比如一批统计数据可以分别用柱状图、饼图来表示。C存在的目的则是确保M和V的同步,一旦M改变,V应该同步更新。MVC 是一种使用 MVC(Mo...
分类:
编程语言 时间:
2015-04-27 23:37:34
阅读次数:
1662