1 基本统计分析 1.1 描述性统计分析 myvar<-c("mpg","hp","wt") head(mtcars[myvar]) #显示数据框的头部信息 dat<-mtcars[myvar] #查看数据框 1.1.1 方法 (1)简单分析:summary() 结果分析:计算了最值、分位数、均值等 ...
分类:
编程语言 时间:
2021-07-06 16:23:03
阅读次数:
0
更多大数据分析、建模等内容请关注公众号《bigdatamodeling》 先简单回顾一下WOE的含义。假设x是类别变量或分箱处理过的连续变量,含R个类别或分段,取值为{C1, ..., Cr, ..., CR};y是目标变量,取值为0(Good)或1(Bad)。x和y的频数表如下: 1、概念回顾 先 ...
分类:
其他好文 时间:
2019-12-15 18:40:26
阅读次数:
315
目的: 1.描述性统计分析 2.频数表和;列连表 3.相关系数和协方差 4.t检验 5.非参数统计 在上一节中使用了图形来探索数据,下一步就是给出具体的数据来描述每个变量的分布和关系 1.描述性统计分析 探究案例:各类车型的油耗如何?对车型的调查中,每加仑汽油行驶的英里数分布是什么形式(均值,标准差 ...
分类:
编程语言 时间:
2018-02-12 11:18:29
阅读次数:
2292
1.首先。我们用surf算法生成图像库中每幅图的特征点及描写叙述符。 2.再用k-means算法对图像库中的特征点进行训练,生成类心。 3.生成每幅图像的BOF。详细方法为:推断图像的每一个特征点与哪个类心近期。近期则放入该类心,最后将生成一列频数表。即初步的无权BOF。 4.通过tf-idf对频数 ...
分类:
编程语言 时间:
2018-02-02 18:29:36
阅读次数:
431
一、 常见检验 1. 独立性检验针对于类别型变量,基于频数表或者列联表来判断两个因素之间的独立性。原假设是两个因素相互独立,P(AB) = P(A)*P(B)。如果得到的P值比较大,说明原假设不独立,可以进而计算Phi系数,列联系数和Cramer's V系数等来判断相关性 2. 相关性的显著性检验是 ...
分类:
其他好文 时间:
2017-10-12 19:13:31
阅读次数:
283
统计的任务 --> 由样本推断总体 1.频数表与直方图 -->将数据取值划分区间,统计每个区间出现的次数 1)读入数据并转换为向量 2)[N,X]=hist(Y,M) Y行列均可、M为划分的份数,默认为10、N返回M个小区间的频数、X返回M个小区间的中点 2.统计量 -->加工后的反应样本数量特征的 ...
分类:
其他好文 时间:
2017-05-19 18:44:42
阅读次数:
210
在实际工作中,往往需要对取得的数据资料进行整理,使其满足特定的分析需求,下面介绍SPSS在资料整理方面的一些功能。1.加权个案加权个案是指给不同的个案赋予不同的权重,以改变该个案在分析中的重要性。为什么要这么做呢?比如某些原始的数据资料每一行代表一个个案,在实际分析时,通常会整理成列联表或频数表,即 ...
分类:
其他好文 时间:
2016-05-28 15:36:36
阅读次数:
186
我们将着眼于类别型变量的频数表和列联表,以及相应的独立性检验、相关性的度量、图形化展示结果的方法还将连带使用vcd包和gmodels包中的函数。数据来自vcd包中的Arthritis数据集library(vcd)一维列联表可以使用table()函数生成简单的频数统计表>mytables<-with(Arthriti..
分类:
编程语言 时间:
2016-04-07 18:48:36
阅读次数:
367
1.首先,我们用surf算法生成图像库中每幅图的特征点及描述符。
2.再用k-means算法对图像库中的特征点进行训练,生成类心。
3.生成每幅图像的BOF,具体方法为:判断图像的每个特征点与哪个类心最近,最近则放入该类心,最后将生成一列频数表,即初步的无权BOF。
4.通过tf-idf对频数表加上权重,生成最终的bof。(因为每个类心对图像的影响不同。比如超市里条形码中的第一位总是6,它对辨...
分类:
编程语言 时间:
2016-03-26 07:30:19
阅读次数:
273
频数表在统计学中是一个非常基本并且重要的概念,我们这里就来讲解它的基本用法。...
分类:
编程语言 时间:
2015-06-09 23:43:07
阅读次数:
1770