白天看了一份PPT,把里面有用的东西截下来,哪天把L2R理好了,整理下~ locality-Sensitive Hashing(MinHash/SimHash) 关联规则:辛普森悖论 ...
分类:
其他好文 时间:
2016-10-12 22:16:53
阅读次数:
191
Apriori: 其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。经典的关联规则数据挖掘算法Apriori 算法广泛应用于各种领域,通过对数据的关联性进行了分析和挖掘,挖掘出的这些信息在决策制定过程中具有重要的参考价值。 Apriori算法广泛应用于商业中,应用于消费市场价格分 ...
分类:
其他好文 时间:
2016-10-09 14:11:21
阅读次数:
207
关联规则 项与项集 数据库中不可分割的最小单位信息称为项(或项目),用符号表示,项的集合称为项集。设集合是项集,中项目的个数为,则集合称为-项集。例如,集合{啤酒,尿布,奶粉}是一个3-项集。 事务 设是由数据库中所有项目构成的集合,事务数据库是由一系列具有唯一标识的事务组成的。每一个事务包含的项集... ...
分类:
其他好文 时间:
2016-09-07 09:11:24
阅读次数:
259
数据挖掘进阶之序列模式挖掘GSP算法 绪 继续数据挖掘方面算法的讲解,前面讲解了数据挖掘中关联规则算法FP-Growth的实现。此篇博文主要讲解基于有趣性度量标准的GSP序列模式挖掘算法。有关论文后期进行补充。实现思路与前面优化的FP-Growth算法一致,首先实现简单的GSP算法,通过认真阅读源码 ...
分类:
其他好文 时间:
2016-09-06 10:33:52
阅读次数:
420
项与项集 数据库中不可分割的最小单位信息称为项(或项目),用符号i表示,项的集合称为项集。设集合是项集,中项目的个数为,则集合称为-项集。例如,集合{啤酒,尿布,奶粉}是一个3-项集。 ...
分类:
其他好文 时间:
2016-09-05 09:10:10
阅读次数:
138
经典的关联规则挖掘算法Apriori和FP-growth,在大数据或者海量数据面前,由于候选集和生成的FP树大而无法存储到内存,同时也由于算法本身单机的特点,决定了它串行处理数据的方式,这在效率上很难满足大数据处理的要求,数据迁移到平台需要传输和转储,在大数据面前,也是一大难题。 一般而言"关联规则 ...
分类:
其他好文 时间:
2016-09-02 13:19:32
阅读次数:
182
一. 概念 关联分析用于发现隐藏在大型数据集中的有意义的联系。所发现的联系可以用关联规则(association rule)或频繁项集的形式表示。 项集:在关联分析中,包含0个或多个项的集合被称为项集(itemset)。如果一个项集包含k个项,则称它为k-项集。例如:{啤酒,尿布,牛奶,花生} 是一 ...
分类:
编程语言 时间:
2016-08-16 22:00:15
阅读次数:
2109
关联规则模型 关联规则模型的特点:就是从大量随机发生的并发时间中,找到强关联的现象,使得在某事件发生的前提下,另一事件的发生具有很高的概率,并且是一种具有业务意义的强规则。 关联规则:Apriori算法、FP树频集算法。 一个关联规则是形如X=》Y的蕴含式,这里X属于I,Y属于I,并且X与Y的交集为 ...
分类:
其他好文 时间:
2016-08-16 10:34:43
阅读次数:
243
关联规则 corresponding analysis http://www.airitilibrary.com/Publication/alDetailedMesh?docid=P20090929006-201002-201003100039-201003100039-75-80 目的:探寻中药性 ...
分类:
其他好文 时间:
2016-08-13 15:39:36
阅读次数:
219
个性化推荐 概念 分类 协同过滤推荐算法 个性化推荐系统技术概览 个性化推荐系统是一种信息过滤方法,它根据用户与物品之间建立的关系,把用户真正需要的物品推荐给用户,以达到过滤无用信息的目的。 个性化推荐的算法可以分成: 基于内容的推荐算法 关联规则算法 协同过滤推荐算法 等等 协同过滤推荐算法 协同 ...
分类:
其他好文 时间:
2016-07-31 18:59:29
阅读次数:
189