码迷,mamicode.com
首页 >  
搜索关键字:统计量    ( 264个结果
数据的统计分析与描述
统计的任务 --> 由样本推断总体 1.频数表与直方图 -->将数据取值划分区间,统计每个区间出现的次数 1)读入数据并转换为向量 2)[N,X]=hist(Y,M) Y行列均可、M为划分的份数,默认为10、N返回M个小区间的频数、X返回M个小区间的中点 2.统计量 -->加工后的反应样本数量特征的 ...
分类:其他好文   时间:2017-05-19 18:44:42    阅读次数:210
【Bootstrap Method】Evaluating The Accuracy of a Classifier
自助法介绍: 非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法,也称为自助法。其核心思想和基本步骤如下:(1)采用重抽样技术从原始样本中抽取一定数量(自己给定)的样本,此过程允许重复抽样。 (2)根据抽出的样本计算给定的统计量T。 (3)重复上述B次(一般大于1000),得到N个统计量 ...
分类:其他好文   时间:2017-05-09 00:55:01    阅读次数:138
节点的排队时延与丢包
节点时延中最复杂和有趣的部分是排队时延\(d_{queue}\)。与其他三种时延不同,排队时延对不同的分组是不同的。在表征排队时延时,通常使用统计量测度,比如平均排队时延、排队时延的方差和排队时延超过某些特定值的概率。 排队时延的决定因素流量到达该队列的速率\(a\ pkt/s\)链路的传输速率\(... ...
分类:其他好文   时间:2017-04-26 22:59:57    阅读次数:873
SAS;TABULATE制作报表
/*TABULATE过程主要是输出统计量表,对整个数据集中的数据的汇总语法PROC TABULATE DATA=<数据集名称> <选项>;CLASS <分类变量> </选项>;VAR <分析变量>;TABLE <<页维表达式> <行维表达式> <列维表达式> </选项>;KEYLABEL 统计量1= ...
分类:其他好文   时间:2017-04-09 13:36:27    阅读次数:1040
卡方检验的用途
卡方检验是基于卡方分布的一种检验方法,属于非参数检验,它统计样本的实际观测值与理论推断值之间的偏离程度,以此计算统计量χ2,χ2越大,二者偏差越大;卡方值越小,二者偏差越小,若两个值完全相等时,χ2值就为0,表明实测值与理论值完全吻合。 很多文献资料中都注明卡方检验适用于分类变量,而一提到分类变量的 ...
分类:其他好文   时间:2017-03-29 20:50:47    阅读次数:1948
今日进展--3月15
一.从incite上获取了各大学的数据,并且将结果保存在了F:paper/organization/ 下的total_c.xls和total_j.xls文件中 二.将total_c和total_j文件导入到了数据库中,并且执行F:\paper\机构差异性\各大学情况分析\代码\sql下的organi ...
分类:其他好文   时间:2017-03-15 22:48:43    阅读次数:315
R语言之描述性和探索性分析
探索性分析简称EDA一、基本描述性统计量1.summary函数可以得到最大值、最小值、中位数和均值2.四分位数四分位数可以通过quantile函数得到,diff得到各分位数的之差> library(RSADBE)> data("TheWALL")> quantile(TheWALL$Score)> ...
分类:编程语言   时间:2017-03-09 18:58:36    阅读次数:1658
统计学中的自由度
数理统计研究问题的方式,不是对所研究对象的全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断。数理统计方法具有“部分推断整体”的特征。 数学中的自由度一般是指能够自由取值的变量个数。数理统计中的自由度是指当以样本的统计量来估计总体的参数时, ...
分类:其他好文   时间:2017-03-08 10:58:17    阅读次数:1765
R语言︱异常值检验、离群点分析、异常值处理
在数据挖掘的过程中,数据预处理占到了整个过程的60% 脏数据:指一般不符合要求,以及不能直接进行相应分析的数据 脏数据包括:缺失值、异常值、不一致的值、重复数据及含有特殊符号(如#、¥、*)的数据 数据清洗:删除原始数据集中的无关数据、重复数据、平滑噪声数据、处理缺失值、异常值等 缺失值处理:删除记 ...
分类:编程语言   时间:2017-02-28 00:21:38    阅读次数:2813
SAS描述统计量
MEANS过程 MEAN过程默认输出的统计量有:观测总数、均值、标准差、最大值和最小值。如果要计算其他统计量或其中的某一些统计量,则可在PROC语句中指定统计量的关键字。 BY语句规定了分组变量,要求在BY分组内计算描述性统计量 。 UNIVARIATE过程 UNIVARIATE过程也可以提供描述统 ...
分类:其他好文   时间:2017-02-11 22:37:17    阅读次数:261
264条   上一页 1 ... 14 15 16 17 18 ... 27 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!