码迷,mamicode.com
首页 >  
搜索关键字:fpgrowth    ( 13个结果
Spark MLlib FPGrowth算法
1.1 FPGrowth算法 1.1.1 基本概念 关联规则挖掘的一个典型例子是购物篮分析。关联规则研究有助于发现交易数据库中不同商品(项)之间的联系,找出顾客购买行为模式,如购买了某一商品对购买其他商品的影响,分析结果可以应用于商品货架布局、货存安排以及根据购买模式对用户进行分类。 关联规则的相关术语如下: (1)项与项集 这是一个集合的概念,在一篮子商品中的一件消费品即为一项(Ite...
分类:编程语言   时间:2015-05-09 17:35:41    阅读次数:201
数据挖掘算法之关联规则挖掘(二)FPGrowth算法
之前介绍的apriori算法中因为存在许多的缺陷,例如进行大量的全表扫描和计算量巨大的自然连接,所以现在几乎已经不再使用 在mahout的算法库中使用的是PFP算法,该算法是FPGrowth算法的分布式运行方式,其内部的算法结构和FPGrowth算法相差并不是十分巨大 所以这里首先介绍在单机内存中运行的FPGrowth算法 还是使用apriori算法的购物车数据作为例子,如下图所示:...
分类:编程语言   时间:2015-04-24 14:22:49    阅读次数:185
PFP(Parallel FPGrowth)
分布式FP-tree1.首先还是对购物篮数据进行排序,计数,假设min_sup=3.去掉支持度小于3的项。2.按照fp-tree的画法,对第二列整理过的项建树,fcamp,fcabm,fb,cbp,fcamp,建立fp-tree如下:3.第三列是从右向左遍历第二列,得到至某点的路径,例如,到p的路径...
分类:其他好文   时间:2015-04-22 23:44:39    阅读次数:293
13条   上一页 1 2
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!