码迷,mamicode.com
首页 > 其他好文 > 详细

SAS描述统计量

时间:2017-02-11 22:37:17      阅读:261      评论:0      收藏:0      [点我收藏+]

标签:img   技术分享   com   关键字   images   个数   span   分析   highlight   

MEANS过程

  • MEAN过程默认输出的统计量有:观测总数、均值、标准差、最大值和最小值。如果要计算其他统计量或其中的某一些统计量,则可在PROC语句中指定统计量的关键字。
  • BY语句规定了分组变量,要求在BY分组内计算描述性统计量 。

  技术分享

proc means data=data.bank
   min p1 q1 mean median q3 p99 max ;
run;

 UNIVARIATE过程

  • UNIVARIATE过程也可以提供描述统计量的计算,另外还有统计频数、绘制图形和假设检验的功能。
  • 使用UNIVARIATE过程计算描述统计量与MEANS过程所用的语句和选项都基本类似,只是UNIVARIATE过程不需要指定统计量关键字,而是默认给出所有的基本统计量和一些关于位置检验的结果。
proc univariate data=data.bank;
run;

 FREQ过程

  • 描述分析,产生频数表和列联表,可以简单的描述数据
  • 统计推断产生各种统计量,分析变量之间的关系
  • TableS 用来定义频数表或交叉表,可以有多个tables语句。当频数表是命令为tables JOB1, 生成一维表;而命令为: tables JOB1*good_bad;变量之间中间用*隔开,表示生成二维交叉表
  • Tables后的选项为norow nocol nopercent:若只需要频数,不需要各行各列的百分比,可在tables后面加上这些参数
proc freq data=data.bank;
  table poutcome*y/norow nocol nopercent;
run;
  • 对连续数值变量做Freq时,系统会对每个数值进行频数统计,这个结果一般不是我们所需要的。我们一般会将连续变量转换为离散变量,这个可以通过Format程步来实现。
proc format;
  value age_cd
  17-<25=‘<25‘
  25-<30=‘25-30‘
  30-<45=‘30-45‘
  45-<60=‘45-60‘
  60-high=‘>=60‘;
run;
proc  freq data=data.bank;
   table y*age/norow nocol nopercent;
   format age age_cd.;
run;

 

SAS描述统计量

标签:img   技术分享   com   关键字   images   个数   span   分析   highlight   

原文地址:http://www.cnblogs.com/karlpearson/p/6390108.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!