码迷,mamicode.com
首页 >  
搜索关键字:统计量    ( 264个结果
R_Studio对数值型数据进行统计量分析
对“Gary.csv”中的成绩数据进行统计量分析 基础数据分析 setwd('D:\\data') #更改工作目录 list.files() #列出当前工作目录下的文件 dat=read.csv(file="Gary.csv",header=TRUE) #读取"Gary.csv文件" dats=da ...
分类:其他好文   时间:2018-09-15 17:07:14    阅读次数:364
数据分析笔试(2)
1、KMO值在( )范围内,因子分析才是有效的。解答:kmo检验统计量是用于比较变量间简单相关系数和偏相关系数的指标,主要用于多元统计的因子分析。当所有变量的简单相关系数的平方和远远大于偏相关系数的平方和时,kmo值越接近于1,原有变量越适合做因子分析。0.7-0.8适合,0.8-0.9很适合,0. ...
分类:其他好文   时间:2018-09-06 16:31:52    阅读次数:569
泰坦尼克号生存预测(python)
1 数据探索 对数据进行一个整体的理解 1.1 查看数据都有一些什么特征 获取数据的10行记录进行观察,初步了解数据的组成,可以看到Age、Cabin里面是存在缺失值的,在进一步理解数据的统计量后再进行数据处理,观察各特征的最大最小值等,可以发现这些数据比较合理,不存在特别的异常值。 2 数据分析\ ...
分类:编程语言   时间:2018-08-31 18:03:18    阅读次数:2670
广义线性模型
指数分布族 如果一类分布可以写成如下的形式,那么它就是属于指数分布族的: P(y;η) = b(y)exp(ηTT(y) - a(η)) (1) 这里η叫做分布的自然参数(natural parameter),或者叫标准参数(canonical parameter);T(y)是充分统计量( suff ...
分类:其他好文   时间:2018-08-23 23:10:23    阅读次数:259
第2章 用图表展示数据
2.1 用图表表示定性数据 1、频数分布表 对数据进行分类,列出所有的类别,然后统计每一类别的频数。 频数:频数分布表中落在某一特定类别的数据个数叫做频数。 有两个变量交叉分类的频数分布表称为列联表,也称交叉表。 定性数据,除了用频数分布表,还可以使用比例、百分比、比率等统计量进行描述。 比例:一个 ...
分类:其他好文   时间:2018-07-30 18:39:30    阅读次数:174
统计学(第六版)9到10单元——学习总结
上面的章节主要讲解了关于假设检验、参数估计、统计分布的推断统计的相关内容,但这些推断统计只是对总体的统计量分析,而且只是一个和两个的。我们进行数据的分析,不能停步与总体,要从宏观进入微观,对数据进行分类统计,查看各分类的关系。接下来的这两张就讲述了关于分类变量和数值变量的关系分析方法。主要分析方法就 ...
分类:其他好文   时间:2018-06-17 20:52:48    阅读次数:178
[公式推导]一般线性秩统计量的方差函数 及其 极限分布
秩 及 线性秩统计量的概念见参考书1的P105或参考书2的P21-P23 定理1 证明 推论1 推论2 推论2应用到线性符号秩统计量中 参考书 1. 陈希孺. 非参数统计教程[M]. 华东师范大学出版社, 1993. 2. 李裕奇. 非参数统计方法[M]. 西南交通大学出版社, 2010. ...
分类:其他好文   时间:2018-06-09 22:08:45    阅读次数:696
python数据统计量分析
#-*- coding: utf-8 -*- #餐饮销量数据统计量分析 from __future__ import print_function import pandas as pd catering_sale = '../data/catering_sale.xls' #餐饮数据 data =... ...
分类:编程语言   时间:2018-05-28 16:03:24    阅读次数:254
python计算IV值及使用
更多风控建模、大数据分析等内容请关注公众号《大数据风控的一点一滴》在对变量分箱后,需要计算变量的重要性,IV是评估变量区分度或重要性的统计量之一,python计算IV值的代码如下:defCalcIV(Xvar,Yvar):N_0=np.sum(Yvar==0)N_1=np.sum(Yvar==1)N_0_group=np.zeros(np.unique(Xvar).shape)N_1_group=
分类:编程语言   时间:2018-05-26 18:53:46    阅读次数:486
R语言计算IV值及使用
更多风控建模、大数据分析等内容请关注公众号《大数据风控的一点一滴》在对变量分箱后,需要计算变量的重要性,IV是评估变量区分度或重要性的统计量之一,R语言计算IV值的代码如下:CalcIV<-function(df_bin,key_var,y_var){N_0<-table(df_bin[,y_var])[1]N_1<-table(df_bin[,y_var])[2]iv_c<
分类:编程语言   时间:2018-05-26 18:43:49    阅读次数:653
264条   上一页 1 ... 9 10 11 12 13 ... 27 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!