前言 在大型图中,节点的低维向量embedding被证明了作为各种各样的预测和图分析任务的特征输入是非常有用的。顶点embedding最基本的基本思想是使用降维技术从高维信息中提炼一个顶点的邻居信息,存到低维向量中。这些顶点嵌入之后会作为后续的机器学习系统的输入,解决像顶点分类、聚类、链接预测这样的 ...
分类:
其他好文 时间:
2019-11-16 23:38:15
阅读次数:
169
一、算法简介 均值漂移算法首先找到一个中心点center(随机选择),然后根据半径划分一个范围 把这个范围内的点输入簇c的标记个数加1 在这个范围内,计算其它点到这个点的平均距离,并把这个平均距离当成偏移量 shift 把中心点center移动偏移量 shift 个单位,当成新的中心点 重复上述步骤 ...
分类:
其他好文 时间:
2019-11-15 00:01:08
阅读次数:
102
介绍 kmeans算法又名k均值算法。 算法思想:先从样本集中随机选取 ??k 个样本作为簇中心,并计算所有样本与这 ??k 个“簇中心”的距离,对于每一个样本,将其划分到与其距离最近的“簇中心”所在的簇中,对于新的簇计算各个簇的新的“簇中心”。实现kmeans算法的三点: (1)簇个数 ??k 的 ...
分类:
编程语言 时间:
2019-11-14 23:55:32
阅读次数:
186
VFH(Viewpoint Feature Histogram)描述子应用于点云聚类识别和六自由度位姿估计问题 (1)训练 给定一个只包含一个物体的场景,这样方便后面聚类的得到。利用一个准确的位姿记录系统获取位姿。获取的不同视角的点云计算VFH描述子。 保存不同视角的点云,并基于此建立kdtree。 ...
分类:
其他好文 时间:
2019-11-14 18:22:49
阅读次数:
263
K-近邻算法 K-K个 N-nearest-最近 N-Neighbor 来源:KNN算法最早是由Cover和Hart提出的一种分类算法 定义 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 距离公式 两个样本的距离可以通过如下公式计 ...
分类:
编程语言 时间:
2019-11-13 13:06:34
阅读次数:
70
第三阶段 无监督学习与序列模型 【核心知识点】 - K-means、GMM以及EM - 层次聚类,DCSCAN,Spectral聚类算法 - 隐变量与隐变量模型、Partition函数 - 条件独立、D-Separation、Markov性质 - HMM以及基于Viterbi的Decoding - ...
分类:
其他好文 时间:
2019-11-12 15:57:17
阅读次数:
174
摘要 多任务学习(Multi-Task Learning, MTL)是机器学习中的一种学习范式,其目的是利用包含在多个相关任务中的有用信息来帮助提高所有任务的泛化性能。 首先,我们将不同的MTL算法分为特征学习法、低秩方法、任务聚类方法、任务关系学习方法和分解方法,然后讨论每种方法的特点。为了进一步 ...
分类:
其他好文 时间:
2019-11-10 19:20:07
阅读次数:
172
一、聚类思想 所谓聚类算法是指将一堆没有标签的数据自动划分成几类的方法,属于无监督学习方法,这个方法要保证同一类的数据有相似的特征,如下图所示: 根据样本之间的距离或者说是相似性(亲疏性),把越相似、差异越小的样本聚成一类(簇),最后形成多个簇,使同一个簇内部的样本相似度高,不同簇之间差异性高。 二 ...
分类:
编程语言 时间:
2019-11-09 21:49:33
阅读次数:
276
Kmeans++算法 Kmeans++算法,主要可以解决初始中心的选择问题,不可解决k的个数。 Kmeans++主要思想是选择的初始聚类中心要尽量的远。 做法: 1. 在输入的数据点中随机选一个作为第一个聚类中心。 2. 对于所有数据点,计算它与最近的聚类中心的距离D(x) 3. 重新选择一个数据点 ...
分类:
编程语言 时间:
2019-11-09 21:46:09
阅读次数:
78
Clustering 聚类K-means 聚类是机器学习和数据挖掘领域的主要研究方向之一,它是一种无监督学习算法,小编研究生时期的主要研究方向是“数据流自适应聚类算法”,所以对聚类算法有比较深刻的理解,于是决定开一个专题来写聚类算法,希望可以为入门及研究聚类相关算法的读者带来帮助。聚类可以作为一个单 ...
分类:
其他好文 时间:
2019-11-09 17:50:03
阅读次数:
99