码迷,mamicode.com
首页 > 其他好文 > 详细

《爱上统计学》笔记(一)

时间:2016-05-13 05:10:00      阅读:115      评论:0      收藏:0      [点我收藏+]

标签:统计学   中位数   平均数   角色   样本   

计算和理解平均数:

  1. 计算均值(算数平均数)

    均值是计算平均数最常用的形式。等于数组中所有数值的总和除以该数组值的个数。

  2. 计算加权平均数

    简单计算的均值,如果出现极端值的情况,并不能反映整体数据的均值,那么我们就需要采用加权平均数。

    加权平均数:每一数值乘以它出现的频数,并将所有的积相加,然后除以频数的总和。

    1)列出要计算均值的样本的所有数值。

    2)列出每一个值出现的频数。

    3)每一数值乘以它的频数

    4)计算“数值*频数”列的所有数值总和。

    5)除以频数的总和。


  3. 计算中位数

    中位数定义为一系列数据的中点,中位数没有标准公式。

    1)以从小到大或者从大到小的顺序列出数据

    2)找到位于中间位置的数据。那就是中位数。

    均值是一系列数值的中间点,而中位数是一系列个体的中间点。

    因为中位数关注的是有多少个体而不是这些个体的数值,极值就不会产生影响。

  4. 计算众数

    众数是最笼统、最不精确的集中趋势量数。但是在理解特定的数据集的特征中扮演着非常重要的角色。

    众数就是出现次数最多的数值。仍然没有计算公式

    1)列出一个数据分布中的所有数值,但是每一个数值只列出一次。

    2)计算每个数值出现的次数。

    3)出现次数最多的就是众数。



何时使用那种测试类型:

  1. 如果数据属性是分类的,而且数值中只属于一种类型,例如头发颜色、政治背景、邻里位置和宗教,就使用众数。这种情况下各个分类之间是互斥的。

  2. 如果数据中包含而且你不想扭曲平均数就是用中位数,例如收入。

  3. 最后,如果数据不包括极值也不是分类数据就使用平均数,例如考试成绩或游五十码需要的时间。

本文出自 “LIBYDWEI” 博客,请务必保留此出处http://libydwei.blog.51cto.com/37541/1772613

《爱上统计学》笔记(一)

标签:统计学   中位数   平均数   角色   样本   

原文地址:http://libydwei.blog.51cto.com/37541/1772613

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!