一般使用weka进行数据挖掘的时候会碰到两个问题,一是内存不够,二是libsvm使用不了,这时就需要重新配置RunWeka.ini文件,解决上述问题。查看RunWeka.ini原文如下: 1 # Contains the commands for running Weka either with a...
分类:
其他好文 时间:
2014-07-07 17:05:42
阅读次数:
234
欢迎转载,转载请注明出处,徽沪一郎。楔子Hive是基于Hadoop的开源数据仓库工具,提供了类似于SQL的HiveQL语言,使得上层的数据分析人员不用知道太多MapReduce的知识就能对存储于Hdfs中的海量数据进行分析。由于这一特性而收到广泛的欢迎。Hive的整体框架中有一个重要的模块是执行模块...
分类:
其他好文 时间:
2014-07-07 14:17:47
阅读次数:
295
相似度计算是数据挖掘,推荐引擎中的最基本问题,例如在推荐系统(Recommender Systems,简称RSs)中计算带推荐物品(Item)相似度,或是用户(User)之间的相似度以期获得兴趣口味(Taste)相似的用户时,均需要使用到相似度计算技术。经常使用的相似度计算方式较多,且各有特点, 以...
分类:
其他好文 时间:
2014-07-07 12:09:43
阅读次数:
448
贝叶斯分类器 贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。眼下研究较多的贝叶斯分类器主要有四种,各自是:Naive Bayes、TAN、BAN和GBN。 贝叶斯网络是一个带有概率...
分类:
其他好文 时间:
2014-07-03 22:53:16
阅读次数:
246
oa: * 控制商业流程按照指定的路线进行 * 在工作流程中,会产生很多数据,我们会对数据做进一步的分析,从而得出一些结论智能分析: 从大量的数据中经过滤过、分析,得出很有用的数据,供决策和参考--》产品经理数据挖掘: 更深层次的数据分析协同: 好几个部门在一起,共同完成一件事情的过程 整个过程是一...
分类:
其他好文 时间:
2014-07-02 14:36:02
阅读次数:
158
Python 对Twitter tweet的元素 (Word, Screen Name, Hash Tag)的频率分析...
分类:
编程语言 时间:
2014-07-02 11:26:40
阅读次数:
258
题目:最近点对(大数据)。
分析:分治法。首先,将所有点按很坐标排序;然后,利用分治求解。
1.将问题转化为两个相同大小的子区间分别求解;
2.中位点为中心,当前最小距离为半径的区间直接枚举求解;
3.求出上两中情况的最小值返回。
说明:这么经典的题目,今天第一次做。
#include
#include
#in...
分类:
其他好文 时间:
2014-07-02 09:41:14
阅读次数:
202
题记
这次《对象程序设计》课程设计,一共给定了8个选题(下载WORD版,PDF版),以及自由选题的机会。从大家初步选题结果来看(图1),绝大部分同学选择了“图形用户界面的计算器”,较少同学选择了3-8题中的一个。一方面,可以看出大家目前的动手能力还有待提高,教师的教学水平还不能给予学生较多的帮助;另一方面,学生缺乏“主动选择、对自己负责”的能力,和从小学到大学一直是被动学习状态有关。李雅...
分类:
其他好文 时间:
2014-07-01 15:13:48
阅读次数:
344
Python 提取Twitter tweets中的元素...
分类:
编程语言 时间:
2014-07-01 09:20:10
阅读次数:
295
第三章 图形入门
本章概要
1 创建和保存图形
2 定义符号、线、颜色和坐标轴
3 文本标注
4 掌控图形维数
5 多幅图合在一起...
分类:
其他好文 时间:
2014-06-29 23:02:54
阅读次数:
300