这篇笔记,仅仅是对选择性算法介绍一下原理性知识,不对公式进行推倒. 前言: 这篇论文介绍的是,如果快速的找到的可能是物体目标的区域,不像使用传统的滑动窗口来暴力进行区域识别.这里是使用算法从多个维度对找到图片中,可能的区域目标,减少目标碎片,提升物体检测效率. 下面是这篇文章的笔记: 介绍及引言: ...
分类:
其他好文 时间:
2017-07-04 20:00:40
阅读次数:
262
大数据是什么?在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中提出:大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。那么究竟多大的数据算是大数据,这个其实并没有明确的定义。不过IBM提出了大数据的5V特点:Volume(大量)、Vel..
分类:
其他好文 时间:
2017-07-03 21:09:43
阅读次数:
154
第六章51、关联规则的挖掘的两个过程1、找出所有的频繁项集2、由频繁项集产生强关联规则52、频繁项集挖掘方法 1、Apriori算法 2、挖掘频繁项集的模式增长方法 3、使用垂直数据格式挖掘频繁项集53、提高Apriori算法的效率 1、基于散列的技术 2、事务压缩 3、划分 4、抽样 5、动态项集 ...
分类:
其他好文 时间:
2017-06-29 23:48:45
阅读次数:
241
hoeffding 不等式 说明了在样本量足够大时,抽样估计能够接近真实值。 类比到ml中,对给定的一个假设空间中的h, 它在整个样本空间中的表现可以由在部分样本点上的表现来近似。也就是说样本足够多的时候,Ein与Eout近似相等。 现在已经知道对任意给定的h,在N足够大时,Ein近似于Eout,如 ...
分类:
其他好文 时间:
2017-06-20 16:19:13
阅读次数:
219
可以看到,统计信息分为三部分内容,头信息,数据字段选择性及直方图。 2.1 头信息 2.2 数据字段选择性 2.3 直方图 直方图,用于计算数据中每个非重复值出现的频率。使用统计信息对象的第一个键列中的列值来计算直方图,可以通过抽样行或者全表扫描的形式。如果是抽样创建,那么,这里边的 存储总行数何非 ...
分类:
数据库 时间:
2017-06-06 23:37:29
阅读次数:
275
1 介绍 假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计判断方法。 其基本原理先对总体特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。 可分为参数假设检验和非参数假设检验,接下来让我们具体介绍参数假设检验。 2 假设检验的思想与 ...
分类:
其他好文 时间:
2017-06-05 23:31:22
阅读次数:
163
1、蒙特卡洛方法 蒙特卡罗方法又称统计模拟法、随机抽样技术,是一种随机模拟方法,以概率和统计理论方法为基础的一种计算方法,是使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。将所求解的问题同一定的概率模型相联系,用电子计算机实现统计模拟或抽样,以获得问题的近似解。为象征性地表明这一方法的概率 ...
分类:
编程语言 时间:
2017-05-31 23:08:59
阅读次数:
594
最大似然法,英文名称是Maximum Likelihood Method,在统计中应用很广。这个方法的思想最早由高斯提出来,后来由菲舍加以推广并命名。 最大似然法是要解决这样一个问题:给定一组数据和一个参数待定的模型,如何确定模型的参数,使得这个确定参数后的模型在所有模型中产生已知数据的概率最大。通 ...
分类:
其他好文 时间:
2017-05-28 17:28:37
阅读次数:
229
一、可视化监控工具 1、jconsole 内存越大,FullGC的时间约长 通过线程活动情况,可以帮助我们估计tomcat的线程池配置的大小 2、jvisualvm.exe 安装所有插件 主要对CPU、内存进行抽样 3、jprofiler 1)安装及连接: 将jprofiler_linux_7_2_ ...
分类:
其他好文 时间:
2017-05-25 10:04:53
阅读次数:
326
Java虚拟机性能管理神器 - VisualVM(3) 插件安装与更新路径配置 插件路径地址配置方法: VisualVM打开后,会发现功能比较单一,只有概述、监视、线程、抽样器、Profiler五个选项卡,只能对JVM进行内存和线程的基础监控和分析。 VisualVM为了能对JVM进行全面的分析和监 ...
分类:
编程语言 时间:
2017-05-23 00:23:00
阅读次数:
820