码迷,mamicode.com
首页 > 编程语言 > 详细

R语言-分组统计

时间:2017-03-21 16:03:05      阅读:459      评论:0      收藏:0      [点我收藏+]

标签:统计   组成   list   写作   gre   参考   each   library   1.3   

分组统计

1、假定有一组成绩数据,要求根据性别进行分组统计:

> score
    ID   score1 score2 Gender
1  101 11.35321    0.9   male
2  102 12.58654    0.6   male
3  103 19.79380    0.9 female
4  104 12.01352    0.4 female
5  105 11.97081    0.4 female
6  106 17.37480    0.7 female
7  107 14.24884    0.3 female
8  108 18.47972    0.8   male
9  109 18.74792    0.8   male
10 110 18.90146    0.7   male

2、方法:使用aggregate(x, by, FUN)

其中x是待折叠的数据对象,by是一个变量名组成的列表,这些变量将被去掉以形成新的观测,而FUN则是用来计算描述性统计量的标量函数,它将被用来计算新观测中的值。 

> aggregate(score[,c(2,3)],list(score[,4]),mean)
  Group.1   score1 score2
1  female 15.08035   0.54
2    male 16.01377   0.76

score[,c(2,3)] 表示对score1和score2列进行分组统计

list(score[,4])表示根据score第4列,也就是性别列进行分组统计。

mean表示统计平均值。

也可以写作下面的形式:

> aggregate(score[,c(2,3)],list(score$Gender),mean)
  Group.1   score1 score2
1  female 15.08035   0.54
2    male 16.01377   0.76


可选参考:

library(dplyr)

group_by(data, sex) %>% summarize_each(funs(mean), var1, var2, var3...)

R语言-分组统计

标签:统计   组成   list   写作   gre   参考   each   library   1.3   

原文地址:http://www.cnblogs.com/awishfullyway/p/6594330.html

(0)
(1)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!