统计检验是将抽样结果和抽样分布相对照而作出判断的工作。主要分5个步骤: 假设检验(hypothesis test)亦称显著性检验(significant test),是统计推断的另一重要内容,其目的是比较总体参数之间有无差别。假设检验的实质是判断观察到的“差别”是由抽样误差引起还是总体上的不同,目的 ...
分类:
编程语言 时间:
2018-07-31 13:37:12
阅读次数:
1159
翻译自官网的文档。转自http://www.mamicode.com/info-detail-507676.html 随机抽样 (numpy.random) 简单的随机数据 rand(d0, d1, ..., dn) 随机值 >>> np.random.rand(3,2) array([[ 0.14 ...
分类:
其他好文 时间:
2018-07-29 16:31:31
阅读次数:
233
目录第一部分 入门第2章 创建数据集第3章 图形初阶第4章 基本数据管理第5章 高级数据管理 第二部分 基本方法第6章 基本图形第7章 基本统计分析 第三部分 中级方法第8章 回归第9章 方差分析第10章 功效分析第11章 中级绘图第12章 重抽样与自助法 第四部分 高级方法第13章 广义线性模型第 ...
分类:
编程语言 时间:
2018-07-22 00:10:06
阅读次数:
237
周爱平,程光,郭晓军.高速网络流量测量方法.软件学报,2014,25(1):135 153. http://www.jos.org.cn/1000 9825/4445.htm 主要问题 可扩展性,不能够适应高速网络环境. 解决方案 利用高性能的专用硬件,极其昂贵; 利用抽样技术,虽然降低了系统的负荷 ...
分类:
其他好文 时间:
2018-07-19 10:46:17
阅读次数:
151
不均衡学习的抽样方法 通常情况下,在不均衡学习应用中使用抽样方法的目的就是为了通过一些机制改善不均衡数据集,以期获得一个均衡的数据分布。 研究表明,对于一些基分类器来说,与不均衡的数据集相比一个均衡的数据集可以提高全局的分类性能。数据层面的处理方法是处理不均衡数据分类问题的重要途径之一,它的实现方法 ...
分类:
其他好文 时间:
2018-07-12 10:34:19
阅读次数:
620
更多风控建模、大数据分析等内容请关注公众号《大数据风控的一点一滴》 在分类问题中常常遇到一个比较头疼的问题,即目标变量的类别存在较大偏差的非平衡问题。这样会导致预测结果偏向多类别,因为多类别在损失函数中所占权重更大,偏向多类别可以使损失函数更小。 处理非平衡问题一般有两种方法,欠抽样和过抽样。欠抽样 ...
分类:
其他好文 时间:
2018-07-01 20:25:55
阅读次数:
184
**更多风控建模、大数据分析等内容请关注公众号《大数据风控的一点一滴》在分类问题中常常遇到一个比较头疼的问题,即目标变量的类别存在较大偏差的非平衡问题。这样会导致预测结果偏向多类别,因为多类别在损失函数中所占权重更大,偏向多类别可以使损失函数更小。处理非平衡问题一般有两种方法,欠抽样和过抽样。欠抽样方法可以生成更简洁的平衡数据集,并减少了学习成本。但是它也带来了一些问题,它会删掉一些有用的样本,尤
分类:
其他好文 时间:
2018-07-01 20:24:39
阅读次数:
165
Girshick, Ross. “Fast r-cnn.” Proceedings of the IEEE International Conference on Computer Vision. 2015. 继2014年的RCNN之后,Ross Girshick在15年推出Fast RCNN,构思 ...
分类:
编程语言 时间:
2018-06-30 15:23:44
阅读次数:
194
测试与正确性论证 首先我们先来说一下这两个概念的差异所在。所谓测试,是指:基于前置条件和后置条件对输入划分并抽样产生测试数据,检查方法执行输出是否满足后置条件。而正确性论证,是指:针对格式化的规格和代码实现,人工方式对代码逻辑进行分析,确认是否所有满足前置条件的输入都能产生满足后置条件的结果。 然后 ...
分类:
其他好文 时间:
2018-06-25 15:21:38
阅读次数:
312
减轻空间混叠效果的最简单的方法是使用大量的光线来生成图像,然后通过平均每个像素内所有光线的颜色来找到每个像素的颜色(即,某种意义上,单个像素的光线越多,该像素就越柔和)。这种方法叫做超抽样。例如,我们可以向每个像素发送9条射线,让每条射线为像素的最终颜色贡献1 / 9。 超级抽样可以帮助减少混叠的影 ...
分类:
其他好文 时间:
2018-06-14 18:07:01
阅读次数:
99