这一章节特别有意思。习题也比较多,但是很容易掌握。主要描述的就是在已知数据结构的基础上,通过增加或修改部分基础操作。来构造更加有效的新数据结构。14.1动态数据统计本节主要介绍如何修改红黑树,使得可以在O(lgn)时间内确定顺序统计量,如何在O(lgn)时间内确定一个元素的秩,即它在集合线性序中的位...
分类:
编程语言 时间:
2015-03-03 18:13:51
阅读次数:
137
在一个由n个元素组成的集合中,第i个顺序统计量是该集合中第i小的元素。输入:一个包含n个(互异的)数的集合A和一个整数i,1 2 int RANDOMZED_SELECT(int A[],int p,int r,int i){ 3 int q,k; 4 if(p==r) 5 ...
分类:
其他好文 时间:
2015-02-13 22:21:17
阅读次数:
193
所谓统计量,就是指没有未知参数的样本的函数。
常见的统计量有:
样本均值:
样本方差:
一般认为 S > 0,称作是样本的标准差。
应当区别样本均值与变量的均值,样本的方差与变量的方差。
样本具有一天然的性质,他们与总体都是同分布的。我们统一设总体的均值是
,方差是 。
值得一说的是,样本方差求和部分的 n 个值并不是完全相互...
分类:
其他好文 时间:
2015-01-18 13:12:51
阅读次数:
519
本文阐述了如何使用期望和线性时间的选择算法求得第i顺序统计量,欢迎拍砖!...
分类:
编程语言 时间:
2014-12-30 17:13:00
阅读次数:
205
转载:http://blog.itpub.net/17203031/viewspace-1067312/Oracle统计量对于CBO执行是至关重要的。RBO是建立在数据结构的基础上的,DDL结构、约束会将SQL语句分为不同的成本结构等级。而CBO是在数据结构的基础上,加入数据表细粒度信息,将成本结构...
分类:
数据库 时间:
2014-12-08 19:33:08
阅读次数:
376
转载:http://blog.itpub.net/17203031/viewspace-1067620/本篇我们继续讨论NO_INVALIDATE参数。从上篇(http://blog.itpub.net/17203031/viewspace-1067312/)讨论情况看,无论是取值true还是fal...
分类:
数据库 时间:
2014-12-08 19:29:29
阅读次数:
483
机器学习问题方法总结大类名称关键词有监督分类决策树信息增益分类回归树Gini指数,Χ2统计量,剪枝朴素贝叶斯非参数估计,贝叶斯估计线性判别分析Fishre判别,特征向量求解K最邻近相似度度量:欧氏距离、街区距离、编辑距离、向量夹角、Pearson相关系数逻辑斯谛回归(二值分类)参数估计(极大似然估计...
分类:
其他好文 时间:
2014-11-27 12:34:58
阅读次数:
369
文章来自网络加课本:
本次学习的内容讨论的问题是在一个由n个不同数值构成的集合中选择第i个顺序统计量问题。主要讲的内容是如何在线性时间内O(n)时间内在集合S中选择第i小的元素,最基本的是选择集合的最大值和最小值。一般情况下选择的元素是随机的,最大值和最小值是特殊情况,书中重点介绍了如何采用分治算法来实现选择第i小的元素,并借助中位数进行优化处理,保证最坏保证运行时间是线性的O(n)。...
分类:
编程语言 时间:
2014-11-22 09:21:35
阅读次数:
286
数据探索: 数据探索有助于选择合适的数据处理与数据分析技术、它甚至可以解决一些数据挖掘问题。 1、汇总统计:量化用单个数或数据的集合展示数据的特性; 如集合的平均值、方差。 2、可视化技术:以图形或表格的形式展示; 如直方图、散布图。 3、OLAP:通过多个属性的限制...
分类:
其他好文 时间:
2014-11-03 22:08:57
阅读次数:
197
1. 寻找第k大(小)的数 假设数据存储在数组a[1..n]中首先,寻找一个数组中最大或者最小的数,因为最大(小)的数一定要比其他所有的数大(小),因此至少要比较完所有的pair才能确定,所以时间复杂度在O(n)。那么寻找第k大(小)呢?比较直观的,就是对数组中国所有的数据先进行排序,在我们这种渣渣...
分类:
编程语言 时间:
2014-10-29 23:37:05
阅读次数:
305