码迷,mamicode.com
首页 >  
搜索关键字:置信度    ( 94个结果
关于apriori算法的一个简单的例子
apriori算法是关联规则挖掘中很基础也很经典的一个算法,我认为很多教程出现大堆的公式不是很适合一个初学者理解。因此,本文列举一个简单的例子来演示下apriori算法的整个步骤。 下面这个表格是代表一个事务数据库D,其中最小支持度为50%,最小置信度为70%,求事务数据库中的频繁关联规则。T...
分类:编程语言   时间:2015-07-24 20:39:28    阅读次数:268
关联分析中的支持度、置信度和提升度
转载自:http://m.blog.csdn.net/blog/sanqima/427464191.支持度(Support) 支持度表示项集{X,Y}在总项集里出现的概率。公式为: Support(X→Y) = P(X,Y) / P(I) = P(X∪Y) / P(I) = num(X...
分类:其他好文   时间:2015-06-24 18:52:08    阅读次数:210
GIS信息关联规则挖掘——Apriori算法的实现(下)
上篇说明了原理,这篇就直接上核心代码了~ 代码比较长,所以理解可能有点麻烦,核心思路就是计算选择的维度后遍历数据,逐步进行循环计算置信度,并淘汰每次循环后的最低值。 这里有一点要注意的,我一开始想用arraylist构造一个堆栈结构进行数据遍历的存储跟计算,因为这样效率比较高。。 但是后来发现,那么做的话,如果以后想要对类型跟因子的种类、数量进行修改的话,需要对代码进行大量重构才能实...
分类:编程语言   时间:2015-05-28 09:34:33    阅读次数:245
【数据分析 R语言实战】学习笔记 第六章 参数估计与R实现(下)
6.3两正态总体的区间估计(1)两个总体的方差已知在R中编写计算置信区间的函数twosample.ci()如下,输入参数为样本x, y,置信度α和两个样本的标准差。> twosample.ci=function(x,y,alpha,sigma1,sigma2){+ n1=length(x);n2.....
分类:编程语言   时间:2015-05-23 23:52:49    阅读次数:362
如何绘制协方差误差椭圆
介绍在这篇文章中,我将展示如何绘制二维正态分布数据的误差椭圆,又名置信椭圆。误差椭圆代表高斯分布的等值轮廓线,并允许可视化一个2D置信区间。下图显示了一组二维正态分布数据样本的95%置信椭圆。这个置信椭圆定义的区域包含了95%的样本,这些样本可以从潜在高斯分布中得到。 在接下来的章节中,我们将讨论如何获得不同置信度(如99%置信区间)的置信椭圆,我们将展示如何用Matlab或C ++代码绘制这些椭...
分类:其他好文   时间:2015-05-23 08:49:26    阅读次数:8927
数据挖掘中的公式
1. 数据预处理阶段,判定冗余数据用到的相关性分析、协方差分析(统计分析):2. 关联规则中的支持度、置信度、相关性分析(概率分析):
分类:其他好文   时间:2015-05-01 22:34:03    阅读次数:184
R in action读书笔记(13)第十章 功效分析
功效分析功效分析可以帮助在给定置信度的情况下,判断检测到给定效应值时所需的样本量。反过来,它也可以帮助你在给定置信度水平情况下,计算在某样本量内能检测到给定效应值的概率。如果概率低得难以接受,修改或者放弃这个实验将是一个明智的选择。10.1假设检验速览在研究过程时,研究者通常关注四个量:样本大小、显...
分类:其他好文   时间:2015-04-28 01:42:17    阅读次数:189
使用Apriori算法进行关联分析
关联分析是一种在大规模数据集中寻找有趣关系的任务。这些关系可以有两种形式:频繁项集或者关联规则。频繁项集是指经常出现在一块的物品的集合,关联规则暗示两种物品之间可能存在很强的关系。一个项集的支持度被定义为数据集中包含该项集的记录所占的比例。可信度或置信度是针对一条诸如{尿布}->{葡萄酒}的关联规则...
分类:编程语言   时间:2015-04-21 17:28:47    阅读次数:156
Apriori算法-java
package com.yang;import java.util.*;public class Apriori { private double minsup = 0.2;// 最小支持度 private double minconf = 0.2;// 最小置信度 // 注意使用IdentityH...
分类:编程语言   时间:2015-04-08 17:59:25    阅读次数:180
正态分布数据检验-偏度峰度检验法
正态分布数据检验-偏度峰度检验法正态数据偏度峰度检验法置信度:1-alpha数据样本数:nsig1=sqrt(6.0*(n-2)/(n+1)/(n+3));sig2=sqrt(24.0*n*(n-2)*(n-3)/(n+1)/(n+1)/(n+3)/(n+5));mu2=3.0-6.0/(n+1);...
分类:其他好文   时间:2015-03-21 14:02:27    阅读次数:474
94条   上一页 1 ... 6 7 8 9 10 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!