码迷,mamicode.com
首页 >  
搜索关键字:聚类 k-meas k均值    ( 1791个结果
[Python数据挖掘]第5章、挖掘建模(上)
一、分类和回归 回归分析研究的范围大致如下: 1、逻辑回归 2、决策树 运行上述代码,生成tree.dot文件,对其稍作修改 得到决策树的可视化 3、人工神经网络 二、评价指标 三、聚类分析 聚类效果评价 聚类可视化——TSNE ...
分类:编程语言   时间:2019-01-28 01:02:51    阅读次数:228
机器学习入门-文本数据-使用聚类增加文本的标签属性
通过对特征做一个kmeans聚类,将聚类的结果做为文本的标签值,可以使得样本的特征更多 我们从sklearn.cluster中导入Kmeans建立模型进行聚类 代码: 第一步:使用Dataframe格式化数据和使用数据格式化数据 第二步:对字符串进行分词和去除停用词,并使用' '.join完成连接 ...
分类:其他好文   时间:2019-01-27 00:20:37    阅读次数:362
如何用SPSS进行数据分析?
SPSS是社会统计科学软件包的简称, 其官方全称为IBM SPSS Statistics。SPSS软件包最初由SPSS Inc.于1968年推出,于2009年被IBM收购,主要运用于各领域数据的管理和统计分析。作为世界社会科学数据分析的标准,SPSS操作操作界面极其友好,结果输出界面也很美观,同时还... ...
分类:其他好文   时间:2019-01-25 16:07:03    阅读次数:295
Python介绍与特点(自学python知识整理)
Python 简介 Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。 Python 的设计: Python 是一种解释型语言: 这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言。 Python 是交互式语言: 这意味着,您可以在一个Python提示符,直 ...
分类:编程语言   时间:2019-01-24 21:55:10    阅读次数:184
转:聚类评价指标
https://www.jianshu.com/p/b5996bf06bd6 15.评价指标 袁一帆 关注 2016.03.05 09:26* 字数 1956 阅读 4065评论 2喜欢 10 1. 分类问题评价指标 1-1. 精确率与召回率 精确率(Precision)指的是模型判为正的所有样本中 ...
分类:其他好文   时间:2019-01-23 17:24:32    阅读次数:206
5.1_非监督学习之sckit-learn
非监督学习之k-means 非监督学习之k-means K-means通常被称为劳埃德算法,这在数据聚类中是最经典的,也是相对容易理解的模型。算法执行的过程分为4个阶段。 1.首先,随机设K个特征空间内的点作为初始的聚类中心。 2.然后,对于根据每个数据的特征向量,从K个聚类中心中寻找距离最近的一个 ...
分类:其他好文   时间:2019-01-22 15:05:29    阅读次数:313
多种聚类算法概述(BIRCH, DBSCAN, K-means, MEAN-SHIFT)
BIRCH:是一种使用树分类的算法,适用的范围是样本数大,特征数小的算法,因为特征数大的话,那么树模型结构就会要复杂很多 DBSCAN:基于概率密度的聚类方法:速度相对较慢,不适用于大型的数据,输入参数有r和k k-means:是通过不断更新聚类中心所进行的一种参数变化,需要输入的参数是需要聚成几类 ...
分类:数据库   时间:2019-01-21 12:13:15    阅读次数:871
机器学习入门-轮廓系数 聚类效果的评估
聚类评估:轮廓系数 计算样本到同簇其他样本的平均距离ai, ai越小,说明样本越应该被聚类到该簇 计算样本到其他簇样本的平均距离bi,这个称为样本与簇Cj的不相似度 s(i) = (b(i) - a(i)) / max(b(i), a(i)) si 接近1, 说明b(i) 远大于a(i), 说明分类 ...
分类:其他好文   时间:2019-01-21 12:12:51    阅读次数:133
转:机器学习sklearn19.0聚类算法——Kmeans算法
https://blog.csdn.net/loveliuzz/article/details/78783773 机器学习sklearn19.0聚类算法——Kmeans算法 ...
分类:编程语言   时间:2019-01-19 15:13:24    阅读次数:187
机器学习入门-K-means算法
无监督问题,我们手里没有标签 聚类:相似的东西聚在一起 难点:如何进行调参 K-means算法 需要制定k值,用来获得到底有几个簇,即几种类型 质心:均值,即向量各维取平均值 距离的度量: 欧式距离和余弦相似度 优化目标: min∑∑dist(ci, xi) 即每种类别的数据到该类别质心距离的之和最 ...
分类:编程语言   时间:2019-01-19 13:20:27    阅读次数:185
1791条   上一页 1 ... 42 43 44 45 46 ... 180 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!