编程珠玑第12章练习题10: 如何从n个对象(可以依次看到这n个对象,但事先不知道n的值)中随机选择一个?具体说来,如何在事先不知道文本文件行数的情况下读取文件,从中随机选择并输出一行? 解答:我们总选择 第1行,并以概率1/2选择第2行,以概率1/3选择第3行,依次类推,在这一过程结束时,每一行选...
分类:
其他好文 时间:
2014-08-05 13:28:19
阅读次数:
261
蒙特卡罗(Monte Carlo)方法,又称随机抽样或统计试验方法,属于计算数学的一个分支,它是在本世纪四十年代中期为了适应当时原子能事业的发展而发展起来的。传统的经验方法由于不能逼近真实的物理过程,很难得到满意的结果,而蒙特卡罗方法由于能够真实地模拟实际物理过程,故解决问题与实际非常符合,可以.....
分类:
其他好文 时间:
2014-07-31 09:40:55
阅读次数:
295
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。(在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数....
分类:
其他好文 时间:
2014-07-24 16:58:45
阅读次数:
239
1. 什么是大数据 五个简单故事告诉你什么是“大数据” 2.如何看待大数据 要全体不要抽样,要效率不要绝对精确,要相关不要因果 3.大数据能干什么 通过用户的使用习惯来预判用户的行为 4.大数据应用场景...
分类:
其他好文 时间:
2014-07-22 08:13:36
阅读次数:
178
日本统计学家写的统计学入门。深入浅出介绍统计学最常见的几个应用场景:抽样调查,随机对照,回归分析等,挺有趣的。对统计学感兴趣的,想复习统计学的,都可以看看。同意作者在书中表达的一个思想:统计学思维是现代人应该掌握的非常重要的一种常识。个人感觉,在个体遇到医疗健康相关的问题,企业家遇到经营管理问题的....
分类:
其他好文 时间:
2014-07-20 22:36:05
阅读次数:
241
1.背景 采样算法是机器学习中比较常用,也比较容易实现的(出去分层采样)。常用的采样算法有以下几种(来自百度知道): 一、单纯随机抽样(simple random sampling)
将调查总体全部观察单位编号,再用抽签法或随机数字表随机抽取部分观察单位组成样本。
优点:操作简单,均数、率及相应的标准误计算简单。
缺点:总体较大时,难以一一编号。
二、系统抽样(systemat...
分类:
编程语言 时间:
2014-07-14 18:08:55
阅读次数:
339
一、 在SAS中进行随机抽样:1、 在实际数据处理中常常需要进行样本抽样,在实践中主要有两种情况:(1)简单无重复抽样(2)分层抽样 a.等比例分层抽样b. 不等比例分层抽样;2、SAS 中可以利用PROC suveryselect 过程实现各种抽样:其一般形式是: PROC SURVEYSELE....
分类:
其他好文 时间:
2014-07-06 19:07:23
阅读次数:
373
本文用讲一下指定分布的随机抽样方法:MC(Monte Carlo), MC(Markov Chain), MCMC(Markov Chain Monte Carlo)的基本原理,并用R语言实现了几个样例:1. Markov Chain (马尔科夫链)2. Random Walk(随机游走)3. MC...
分类:
其他好文 时间:
2014-06-26 17:32:16
阅读次数:
189
蒙特卡罗方法又称统计模拟法、随机抽样技术,是一种随机模拟方法,以概率和统计理论方法为基础的一种计算方法,是使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。将所求解的问题同一定的概率模型相联系,用电子计算机实现统计模拟或抽样,以获得问题的近似解。为象征性地表明这一方法的概率统计特征,数学家冯...
分类:
其他好文 时间:
2014-06-25 12:20:15
阅读次数:
347