一般使用weka进行数据挖掘的时候会碰到两个问题,一是内存不够,二是libsvm使用不了,这时就需要重新配置RunWeka.ini文件,解决上述问题。查看RunWeka.ini原文如下: 1 # Contains the commands for running Weka either with a...
分类:
其他好文 时间:
2014-07-07 17:05:42
阅读次数:
234
相似度计算是数据挖掘,推荐引擎中的最基本问题,例如在推荐系统(Recommender Systems,简称RSs)中计算带推荐物品(Item)相似度,或是用户(User)之间的相似度以期获得兴趣口味(Taste)相似的用户时,均需要使用到相似度计算技术。经常使用的相似度计算方式较多,且各有特点, 以...
分类:
其他好文 时间:
2014-07-07 12:09:43
阅读次数:
448
贝叶斯分类器 贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。眼下研究较多的贝叶斯分类器主要有四种,各自是:Naive Bayes、TAN、BAN和GBN。 贝叶斯网络是一个带有概率...
分类:
其他好文 时间:
2014-07-03 22:53:16
阅读次数:
246
Python 对Twitter tweet的元素 (Word, Screen Name, Hash Tag)的词汇多样性分析...
分类:
编程语言 时间:
2014-07-03 18:48:39
阅读次数:
222
oa: * 控制商业流程按照指定的路线进行 * 在工作流程中,会产生很多数据,我们会对数据做进一步的分析,从而得出一些结论智能分析: 从大量的数据中经过滤过、分析,得出很有用的数据,供决策和参考--》产品经理数据挖掘: 更深层次的数据分析协同: 好几个部门在一起,共同完成一件事情的过程 整个过程是一...
分类:
其他好文 时间:
2014-07-02 14:36:02
阅读次数:
158
Python 对Twitter tweet的元素 (Word, Screen Name, Hash Tag)的频率分析...
分类:
编程语言 时间:
2014-07-02 11:26:40
阅读次数:
258
Python 提取Twitter tweets中的元素...
分类:
编程语言 时间:
2014-07-01 09:20:10
阅读次数:
295
数据预处理包括数据的缺失值处理、标准化、规范化和离散化处理。数据的缺失值处理:weka.filters.unsupervised.attribute.ReplaceMissingValues。对于数值属性,用平均值代替缺失值,对于nominal属性,用它的mode(出现最多的值)来代替缺失值。标准化...
分类:
其他好文 时间:
2014-07-01 00:19:47
阅读次数:
392
一、数据挖掘数据挖掘是运用计算机及信息技术,从大量的、不全然的数据集中获取隐含在当中的实用知识的高级过程。Web 数据挖掘是从数据挖掘发展而来,是数据挖掘技术在Web 技术中的应用。Web 数据挖掘是一项综合技术,通过从Internet 上的资源中抽取信息来提高Web 技术的利用效率,也就是从Web...
分类:
Web程序 时间:
2014-06-29 19:45:59
阅读次数:
452