聚类分析有很多种,效果好不好大概要根据数据特征来确定。最常见的是kmeans法聚类>setwd("D:\\R_test")
>data_in<-read.delim("tmp_result.txt",header=T)
>fit<-kmeans(data_in,3)
>library(cluster)
>clusplot(data_in,fit$cluster,color=T,shade=T,lab..
分类:
编程语言 时间:
2016-06-28 14:38:36
阅读次数:
808
Kmeans算法的缺陷 ? 聚类中心的个数K 需要事先给定,但在实际中这个 K 值的选定是非常难以估计的,很多时候,事先并不知道给定的数据集应该分成多少个类别才最合适? Kmeans需要人为地确定初始聚类中心,不同的初始聚类中心可能导致完全不同的聚类结果。(可以使用Kmeans++算法来解决) K- ...
分类:
编程语言 时间:
2016-06-25 19:09:57
阅读次数:
562
BagOfWords: 1. 见上一篇jieba分词。 2. 见上篇,读取分词后文件 3. 统计词频并表示成向量: sklearn工具包方法: ...
分类:
其他好文 时间:
2016-06-23 12:38:16
阅读次数:
160
1. 聚类问题 所谓聚类问题,就是给定一个元素集合D,其中每个元素具有n个可观察属性,使用某种算法将D划分成k个子集,要求每个子集内部的元素之间相异度尽可能低,而不同子集的元素相异度尽可能高。 2. K-均值算法简介 k-means算法,也被称为k-平均或k-均值,是一种得到最广泛使用的聚类算法。 ...
分类:
编程语言 时间:
2016-05-31 13:54:34
阅读次数:
118
使用vlfeat工具箱中的vl_kmeans函数会报错: 尝试将 SCRIPT vl_kmeans 作为函数执行 这是因为工具包中vl_kmeans是脚本注释程序,需要运行vlfeat工具包中的vl_setup编译mex文件 才可以在自己的程序中调用vl_kmeans函数。 ...
分类:
其他好文 时间:
2016-05-20 17:21:24
阅读次数:
1233
1. 聚类:将拥有最相似属性的数据归为一类. K-means聚类: python调用格式:compacness, labels, centers = cv2.kmeans(data, K, criteria, bestLabels=None, attempts, flags, centers=Non ...
分类:
其他好文 时间:
2016-05-13 12:09:09
阅读次数:
114
python环境下的测试程序 import numpy as np import cv2 import matplotlib.pyplot as plt #in this example, we test Kmeans clutering algorithm under python. ''' #f ...
分类:
编程语言 时间:
2016-05-13 11:26:53
阅读次数:
308
老规矩,直接贴报告~
Programe list:
Programe was developed in the condition of Windows aswell as Linux server, programming language is Matlab (www.mathworks.com).
Classify.m, Kmeans.m: function for K-means...
分类:
编程语言 时间:
2016-05-12 18:22:48
阅读次数:
362
背景: 目的:要用Python下的DBSCAN聚类算法。 scikit-learn 是一个基于SciPy和Numpy的开源机器学习模块,包括分类、回归、聚类系列算法,主要算法有SVM、逻辑回归、朴素贝叶斯、Kmeans、DBSCAN等,目前由INRI 资助,偶尔Google也资助一点。 SciPy是 ...
分类:
编程语言 时间:
2016-05-06 20:18:39
阅读次数:
284
首先要来了解的一个概念就是聚类,简单地说就是把相似的东西分到一组,同 Classification (分类)不同,对于一个 classifier ,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一个 classifier 会从它得到的训练集中进行“学习”,从而具备对未知数据进行分类的能力,这种提供训练数据的过程通常叫做 supervised learning (监督学习),而在...
分类:
编程语言 时间:
2016-04-29 18:33:44
阅读次数:
358