本人也是借鉴网上他人资料。主要介绍使用java调用Weka库。 首先介绍weka,Weka的全名是怀卡托智能分析环境,是基于开源环境的机器学习和数据挖掘软件。我们可以去weka官网下载最新的Weka软件,目前最新版本是3.7.9。默认安装会保存在C:\Program Files\Weka-3-...
分类:
其他好文 时间:
2014-07-11 23:13:24
阅读次数:
269
现在我们介绍使用Weka来对数据进行分类。对数据进行分类,我们必须先指定那一列作为预测类别。因为数据文件格式的问题,类别一般都是最后一列属性。我们可以使用setClassIndex来设置类别。然后我们要选择分类器,分类器有很多,我们暂时使用J48分类器。对数据进行训练可以使用buildClassi....
分类:
其他好文 时间:
2014-07-11 22:22:27
阅读次数:
378
这次我们介绍Evaluation类。在上一次中我们只是单纯的预测了分类值,并没有其他评价数据。这场我们使用Evalution类。首先初始化一个Evaluation对象,Evaluation类没有无参的构造函数,一般用Instances对象作为构造函数的参数。如果我们没有训练数据和测试数据,那么我们可...
分类:
其他好文 时间:
2014-07-11 21:18:34
阅读次数:
259
Python 对Twitter中指定话题的被转载Tweet数量的频谱分析...
分类:
编程语言 时间:
2014-07-10 23:29:30
阅读次数:
311
Python 对新浪微博的元素 (Word, Screen Name)的词汇多样性分析...
分类:
编程语言 时间:
2014-07-10 21:49:09
阅读次数:
206
Python 对Twitter中指定话题的Tweet基本元素的频谱分析...
分类:
编程语言 时间:
2014-07-10 20:16:46
阅读次数:
265
Python 对新浪微博的博文元素 (Word, Screen Name)的频率分析...
分类:
编程语言 时间:
2014-07-10 19:45:37
阅读次数:
191
贝叶斯分类器 贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。眼下研究较多的贝叶斯分类器主要有四种,各自是:Naive Bayes、TAN、BAN和GBN。 贝叶斯网络是一个带有概率...
分类:
其他好文 时间:
2014-07-09 15:36:36
阅读次数:
134
Python 可视化Twitter中指定话题中Tweet的词汇频率...
分类:
编程语言 时间:
2014-07-08 10:45:15
阅读次数:
198
Python 提取新浪微博的博文中的元素(包含Text, Screen_name)...
分类:
编程语言 时间:
2014-07-08 10:44:37
阅读次数:
281