码迷,mamicode.com
首页 > 其他好文 > 详细

机器学习实战 -> 无监督学习

时间:2015-09-09 16:46:07      阅读:163      评论:0      收藏:0      [点我收藏+]

标签:

使用后处理来提高聚类性能

利用误差来评价聚类的质量

一种衡量的指标是SSE:误差平方和,该方法更为重视远离簇中心的点。

一种方法是将具有最大SSE值的簇划分成两个簇。将该簇内重新进行分簇。

如果要保持簇的数目不变,可以再讲两个粗合并。合并最小的质心或者合并两个使得SSE枕骨最小的质心。

二分K-均值算法

先将所有点作为一个簇,然后将该粗一分为2,然后再选择其中一个簇进行划分。选择哪一个簇进行划分取决于划分是否可以最大程度的降低SSE的值。

或者

选择SSE最大的簇进行划分,直到簇的数目达到用户指定的数目位置。の3

使用Apriori算法进行关联分析

从频繁项集之中挖掘关联规则

机器学习实战 -> 无监督学习

标签:

原文地址:http://www.cnblogs.com/chengxuyuanxiaowang/p/4794940.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!