一.聚类(clustering) 1.k-均值聚类(k-means) 这是机器学习领域除了线性回归最简单的算法了。该算法用来对n维空间内的点根据欧式距离远近程度进行分类。 INPUT: K(number of clusters) Training set{x1,x2,x3,....xn} (xi b ...
分类:
编程语言 时间:
2019-10-04 09:16:15
阅读次数:
792
机器学习简介: 特征向量 目标函数 机器学习分类: 有监督学习:分类问题(如人脸识别、字符识别、语音识别)、回归问题 无监督学习:聚类问题、数据降维 强化学习:根据当前状态预测下一个状态,回报最大化,回报具有延迟性,如无人驾驶、下围棋 深度学习数学知识:微积分、线性代数、概率论、最优化方法 一元函数 ...
分类:
其他好文 时间:
2019-10-03 12:58:27
阅读次数:
120
K-均值(K-Means)算法用于解决无监督学习中聚类问题,其输入为聚类组数量$K$,以及数据集${x^{(1)},x^{(2)},dots,x^{(m)}}$,其中$x^{(i)}inmathbb{R}^n$(不再添加$x^{(i)}_0=1$这一项)。算法步骤为:首先需要随机选取$K$个聚类中心... ...
分类:
编程语言 时间:
2019-10-01 11:27:26
阅读次数:
82
今天在数据人网上看到一篇文章。区分监督学习和无监督学习,监督学习的数据就是有标签数据,无监督学习的数据就是无标签数据。这是我的理解,欢迎指教。 原文链接http://www.shujuren.org/article/62.html 原文如下 监督式和非监督式机器学习算法 作者 Frankchen 什 ...
分类:
其他好文 时间:
2019-09-23 22:38:36
阅读次数:
406
统计学习方法之统计学习概论 统计学习(statistical learning),也称为统计机器学习(statistical maching learning)。 统计学习由监督学习(supervised learning)、无监督学习(unsupervised learning)和强化学习(rei ...
分类:
其他好文 时间:
2019-09-13 15:16:47
阅读次数:
113
什么是图像分割 图像分割(Image Segmentation)是图像处理最重要的处理手段之一 图像分割的目标是将图像中像素根据一定的规则分为若干(N)个cluster集合,每个集合包含一类像素。 根据算法分为监督学习方法和无监督学习方法,图像分割的算法多数都是无监督学习方法 - KMeans 距离... ...
分类:
其他好文 时间:
2019-09-11 12:09:55
阅读次数:
170
什么是聚类任务 “无监督学习”中研究最多,应用最广的学习任务,除此之外,还有密度估计(density estimation)和异常检测(anomaly detection)。在无监督学习中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习揭示数据的内在性质及规律,为进一步的数据分析提供基 ...
分类:
编程语言 时间:
2019-09-07 18:29:06
阅读次数:
173
在机器学习中,我们经常会分类为有监督学习和无监督学习,但是尝尝会忽略一个重要的分支,强化学习。有监督学习和无监督学习非常好去区分,学习的目标,有无标签等都是区分标准。如果说监督学习的目标是预测,那么强化学习就是决策,它通过对周围的环境不断的更新状态,给出奖励或者惩罚的措施,来不断调整并给出新的策略。 ...
分类:
其他好文 时间:
2019-08-27 12:20:01
阅读次数:
116
降维算法应用:数据压缩、数据可视化。 主成分分析(PCA)是最常见的降维算法。 在 PCA 中,我们要做的是找到一个方向向量(Vector direction),当我们把所有的数据 都投射到该向量上时,我们希望投射平均均方误差能尽可能地小。方向向量是一个经过原点 的向量,而投射误差是从特征向量向该方 ...
分类:
其他好文 时间:
2019-08-16 00:53:54
阅读次数:
145
聚类分析是在数据中发现数据对象之间的关系,将数据进行分组,组内的相似性越大,组间的差别越大,则聚类效果越好。 此次我们学习聚类中的第一个算法——K-均值算法。K-均值算法本质就是重复将样本分配的类里面,不断的更新类的重心位置。 这里将围绕K-均值算法讨论目标优化、随机初始化和如何选择聚类数。 K-M ...
分类:
编程语言 时间:
2019-08-16 00:44:50
阅读次数:
112