相似度计算是数据挖掘,推荐引擎中的最基本问题,例如在推荐系统(Recommender Systems,简称RSs)中计算带推荐物品(Item)相似度,或是用户(User)之间的相似度以期获得兴趣口味(Taste)相似的用户时,均需要使用到相似度计算技术。经常使用的相似度计算方式较多,且各有特点, 以...
分类:
其他好文 时间:
2014-07-07 12:09:43
阅读次数:
448
1、 统计学与数据挖掘的区别: 统计学主要利用概率论建立数学模型,是研究随机现象的常用数学工具之一。 数据挖掘分析大量数据,发现其中的内在联系和知识,并以模型或规则表达这些知识。 虽然两者采用的某些分析方法(如回归分析)是相同的,但是数据挖掘和统计学是有本质区别的: 一个主要差别在于处理对象(数据集...
分类:
其他好文 时间:
2014-07-06 21:40:15
阅读次数:
217
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, N...
分类:
其他好文 时间:
2014-07-06 19:26:24
阅读次数:
221
近期在做数据挖掘的课程设计,须要将数据分析的结果非常直观的展现给用户,这就要用到数据统计图,要实现这个功能就须要几个第三方包了:1. jfreechart-1.0.13.jar2. jcommon-1.0.16.jar3. gnujaxp.jar先来看一下,终于效果图:主要是jfreechart-1...
分类:
编程语言 时间:
2014-07-05 16:45:37
阅读次数:
192
贝叶斯分类器 贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。眼下研究较多的贝叶斯分类器主要有四种,各自是:Naive Bayes、TAN、BAN和GBN。 贝叶斯网络是一个带有概率...
分类:
其他好文 时间:
2014-07-03 22:53:16
阅读次数:
246
Python 对Twitter tweet的元素 (Word, Screen Name, Hash Tag)的词汇多样性分析...
分类:
编程语言 时间:
2014-07-03 18:48:39
阅读次数:
222
oa: * 控制商业流程按照指定的路线进行 * 在工作流程中,会产生很多数据,我们会对数据做进一步的分析,从而得出一些结论智能分析: 从大量的数据中经过滤过、分析,得出很有用的数据,供决策和参考--》产品经理数据挖掘: 更深层次的数据分析协同: 好几个部门在一起,共同完成一件事情的过程 整个过程是一...
分类:
其他好文 时间:
2014-07-02 14:36:02
阅读次数:
158
Python 对Twitter tweet的元素 (Word, Screen Name, Hash Tag)的频率分析...
分类:
编程语言 时间:
2014-07-02 11:26:40
阅读次数:
258
Python 提取Twitter tweets中的元素...
分类:
编程语言 时间:
2014-07-01 09:20:10
阅读次数:
295