码迷,mamicode.com
首页 >  
搜索关键字:聚类    ( 1791个结果
系统聚类法
1. 概述 系统聚类法也称为多层次聚类法,分类的单位由高到低呈树状结构,且所处的位置越低其包含的样本点就越少,共同特征越多。这种方法适合于数据量较小的情况,当数据量较大时系统聚类法的速度较慢。 2. 算法核心思想 其做法是开始时把每个样品作为一类,然后把最靠近的两个或若干个样品(即距离最小的群品)首 ...
分类:其他好文   时间:2020-02-06 13:04:45    阅读次数:131
复杂度分析---平摊分析(Amortized Analysis)
平摊分析(Amortized Analysis) 参考链接:https://blog.csdn.net/Ying_Xu/article/details/51433497 1、聚类分析 2、记账方法 3、势能方法 其中的公式Ci表示为执行当前操作需要的花销 push操作:势能增加1,操作花销为1,因此 ...
分类:其他好文   时间:2020-02-04 23:24:50    阅读次数:71
1.2:无监督学习导学
无监督学习的目标: 利用无标签的数据学习数据的分部或数据与数据之间的关系被称作无监督学习。 无监督学习最常应用的场景是聚类和降维。 聚类 (sklearn.cluster模块) 定义 聚类(clustering),就是根据数据的“相似性”将数据分为多类的过程。 评估两个不同样本之间的“相似性” ,通 ...
分类:其他好文   时间:2020-02-02 21:52:21    阅读次数:120
MachineLearning入门-2
Scikit-learn Scikit-learn是Python中开发和实践机器学习的类库之一,依赖于Scipy及其相关类库来运行。 Scikit-learn的基本功能主要分为六大类:分类,回归,聚类,数据降维,模型选择,数据处理。需要指出的是,由于Scikit-learn本身不支持深度学习,也不支 ...
分类:系统相关   时间:2020-02-01 13:00:26    阅读次数:84
Spark学习10_1 sparkMllib入门与相关资料索引
[TOC] 资料 "Spark机器学习库(MLlib)中文指南" "关于spark机器学习的知乎专栏" "Spark入门实战系列 8.Spark MLlib(上) 机器学习及SparkMLlib简介" "基本Kmeans算法介绍及其实现" [spark MLlib 概念 1:相关系数( PPMCC ...
分类:其他好文   时间:2020-01-31 13:59:26    阅读次数:104
文本聚类
聚类Agglomerative Clustering 及其三种方法Single-linkage、Complete-linkage,Group average 词干提取(stemming)和词形还原(lemmatization) 凝聚法层次聚类之ward linkage method ...
分类:其他好文   时间:2020-01-30 19:27:04    阅读次数:83
关于TiTanic存活预测实战(一、数据分析)
一、前言 虽然一直算IT男,但是基本没有接触过最前沿的IT知识,一直在做生产方面的IT,突发奇想,开始学习算法,学习算法有半年多了,从最初的Python,到线性回归、逻辑回归、SVM,聚类,NLP,CNN,RNN,GAN等神经网络,感觉知识的海洋真是浩瀚如海,今天打算开始分享一下我的一些学习情况,第 ...
分类:其他好文   时间:2020-01-23 22:49:24    阅读次数:108
数据建模()-K-means聚类算法
K-Means算法是典型基于距离的非层次聚类算法,在最小化误差函数的基础上将数据划分为预定的类数K,采用作为相似性的评价指标,即认为2个对象的距离越近,其相似度越大。 1.算法过程 1)从N个样本数据中随机选取K个对象作为初始的聚类中心 2)分别计算每个样本到各聚类中心的距离,将对象分配到距离最近的 ...
分类:编程语言   时间:2020-01-23 11:04:46    阅读次数:105
第八周 第一部分
聚类 非监督学习的算法 从未标记的数据中学习。所以,在非监督学习中我们要做的是给这种 没有标记的训练集合一个算法并且通过算法来为我们定义一些数据的结构。 对于这种结构的数据集,我们通过算法来发现他们 就像被分成两个聚类的点集 因此对于一种算法能够找到 被圈出来的类别,就称为聚类算法 比如说 到目前为 ...
分类:其他好文   时间:2020-01-20 14:51:02    阅读次数:68
机器学习--K均值聚类算法原理、方法及代码实现
一、K-means算法原理 k-means算法是一种简单的迭代型聚类算法,采用距离作为相似性指标,从而发现给定数据集中的K个类,且每个类的中心是根据类中所有值的均值得到,每个类用聚类中心来描述。对于给定的一个包含n个d维数据点的数据集X以及要分得的类别K,选取欧式距离作为相似度指标,聚类目标是使得各 ...
分类:编程语言   时间:2020-01-19 18:59:10    阅读次数:91
1791条   上一页 1 ... 19 20 21 22 23 ... 180 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!