基于样本分布与理论分布之间的偏离程度构建统计量,得到一个统计量的抽样分布。 判断样本分布与理论分布之间的偏离程度是抽样误差还是实质性变化,具体而言就是样本值与理论值之间的差值是抽样误差造成的还是本身就这样。令样本统计量(O)与总体真值(E)之间的差值作为统计量,用平方(O-E)来表现样本分布与理论分 ...
分类:
其他好文 时间:
2019-09-25 12:34:53
阅读次数:
184
应用统计学 统计量与抽样分布 精确估计:当总体满足正态分布时。一个样本参数估计,估计总体均值时。 总体方差已知时,用样本均值满足抽样分布来估计,(其中,抽样分布是正态分布,抽样分布均值是总体均值,抽样分布方差是总体方差与样本数的比值)来估计,即如下式: 此方法的进阶版就是将样本均值写成Z分布形式,z ...
分类:
其他好文 时间:
2019-09-21 00:49:35
阅读次数:
130
生物统计学 抽样分布:n个样本会得到n个统计量,将这n个统计量作为总体,该总体的分布即是抽样分布 根据辛钦大数定律,从一个非正态分布的总体中抽取的含量主n的样本,当n充分大时,样本平均数渐近服从正态分布。因此平均数的抽样分布对正态性的要求并不是十分严格,但方差的抽样分布,对总体的正态性的要求是十分严 ...
分类:
其他好文 时间:
2019-09-16 09:32:11
阅读次数:
286
使用 火焰图的含义 1. 火焰图是基于 stack 信息生成的 SVG 图片, 用来展示 CPU 的调用栈。 y 轴表示调用栈, 每一层都是一个函数. 2. 调用栈越深, 火焰就越高, 顶部就是正在执行的函数, 下方都是它的父函数. x 轴表示抽样数, 如果一个函数在 x 轴占据的宽度越宽, 3. ...
分类:
其他好文 时间:
2019-09-06 21:16:42
阅读次数:
77
本次使用木东居士提供数据案例,验证数据分布等内容,参考链接:https://www.jianshu.com/p/6522cd0f4278,先感谢上面两位。 只贴了代码。。。结果图片没得了 ...
分类:
编程语言 时间:
2019-09-01 23:35:39
阅读次数:
115
样本均值、样本比例和样本方差的抽样分布 样本均值的抽样分布 在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布 一种理论概率分布 推断总体均值$\mu$的理论基础 大数定律表明:当来自于独立同分布(i.i.d)的总体(该总体均值为$\mu$,方差为$\sigma^2$)中$n$个 ...
分类:
其他好文 时间:
2019-08-24 23:16:15
阅读次数:
221
为了推断总体的某些特征,我们需要抽取若干个体,这一过程称为抽样,所抽取的这部分个体称为样本,样本中包含的个体数量称为样本量。但是抽样得到的样本是杂乱无章的,虽然包含了一部分总体的信息,却难以发掘出来。因此,需要对样本数据进行一定的处理(构造函数),算出一些具有代表性的、可以反映总体特征的数字,这样的 ...
分类:
其他好文 时间:
2019-08-21 13:49:38
阅读次数:
94
一、bagging和boosting的区别 参考:https://blog.csdn.net/blank_tj/article/details/82229322 简单总结Bagging:对数据集进行多次有放回抽样,每次的抽样进行分类计算生成弱分类器,分类问题就是把每一次的计算结果进行投票,看哪一种情 ...
分类:
其他好文 时间:
2019-08-19 10:03:43
阅读次数:
630
蒙特卡洛方法也称为统计模拟法、随机抽样技术、计算机随机模拟方法,以概率和统计理论方法为基础的一种计算方法,是使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。它源于世界著名的赌城—摩纳哥的Monte Carlo(蒙特卡洛)。将所求解的问题同一定的概率模型相联系,用电子计算机实现统计模拟或抽样 ...
分类:
编程语言 时间:
2019-08-13 15:24:43
阅读次数:
91
其实简单的来说,大数据就是通过分析和挖掘全量的非抽样的数据辅助决策。大数据可以实现的应用可以概括为两个方向,一个是精准化定制,第二个是预测。比如像通过搜索引擎搜索同样的内容,每个人的结果却是大不相同的。再比如精准营销、百度的推广、淘宝的喜欢推荐,或者你到了一个地方,自动给你推荐周边的消费设施等等。随着大数据行业的快速发展,也随之出现了一些问题,比如大数据人才的缺失就是目前急需解决的一个问题,那么很
分类:
其他好文 时间:
2019-08-11 12:51:54
阅读次数:
117