简介 前面介绍的线性回归,SVM等模型都是基于数据有标签的监督学习方法,本文介绍的聚类方法是属于无标签的无监督学习方法。其他常见的无监督学习还有密度估计,异常检测等。 聚类就是对大量未知标注的数据集,按照数据的内在相似性将数据集划分为多个类别(在聚类算法中称为簇),使类别内的数据相似度高,二类别间的 ...
分类:
其他好文 时间:
2018-10-20 16:15:10
阅读次数:
140
聚类是机器学习中一种方法,常用用于处理数据分组的问题。给定一组数据,利用聚类算法将每一个数据点分批到一个特定的组。这就要求 对于同一组的数据点,应该具有相同的性质(特征);对于不同组的数据点,在性质(特征)上应该有显著的区别 。聚类算法数据无监督学习(unsupervised learning),常 ...
分类:
编程语言 时间:
2018-10-19 13:57:22
阅读次数:
227
无监督学习 Unsupervised learning allows us to approach problems with little or no idea what our results should look like. We can derive structure from data ...
分类:
其他好文 时间:
2018-10-16 18:42:21
阅读次数:
235
前言随着机器学习近年来的流行,尤其是深度学习的火热。机器学习算法在很多领域的应用越来越普遍。最近,我在一家广告公司做广告点击反作弊算法研究工作。想到了异常检测算法,并且上网调研发现有一个算法非常火爆,那就是本文要介绍的算法 Isolation Forest,简称 iForest 。 南大周志华老师的 ...
分类:
其他好文 时间:
2018-10-14 17:50:37
阅读次数:
2245
机器学习的常用方法:主要分为有监督学习(supervised learning)和无监督学习(unsupervised learning)。 监督学习,就是人们常说的分类,通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是 ...
分类:
其他好文 时间:
2018-10-14 13:54:48
阅读次数:
130
隐含马尔可夫模型并不是俄罗斯数学家马尔可夫发明的,而是美国数学家鲍姆提出的,隐含马尔可夫模型的训练方法(鲍姆 韦尔奇算法)也是以他名字命名的。隐含马尔可夫模型一直被认为是解决大多数自然语言处理问题最为快速、有效的方法。 现实世界中有一类问题具有明显的时序性,比如路口红绿灯、连续几天的天气变化,我们说 ...
分类:
编程语言 时间:
2018-10-06 16:36:44
阅读次数:
1461
概念 监督学习(Supervised Learning) 从给定标注的训练数据集中学习出一个函数,根据这个函数为新函数进行标注 无监督学习(Unsupervised Learning) 从给定无标注的训练数据中学习出一个函数,根据这个函数为所有数据标注 分类(Classification) 监督学习 ...
分类:
编程语言 时间:
2018-10-05 01:02:52
阅读次数:
362
LDA算法的主要优点有: 在降维过程中可以使用类别的先验知识经验,而像PCA这样的无监督学习则无法使用类别先验知识。 LDA在样本分类信息依赖均值而不是方差的时候,比PCA之类的算法较优。 LDA算法的主要缺点有: LDA不适合对非高斯分布样本进行降维,PCA也有这个问题。 LDA降维最多降到类别数 ...
分类:
其他好文 时间:
2018-10-02 17:50:31
阅读次数:
306
1. 用于执行分类,回归,聚类和密度估计的机器学习方法: a. 监督学习的用途: b. 无监督学习的用途: 2. 选择合适的算法: 如果是想要预测目标变量的值,则可以选择监督学习算法,否则选择无监督学习算法。 确定监督学习算法之后,进一步确定目标变量类型,如果目标变量是离散型,如1/2/3,A/B/ ...
分类:
其他好文 时间:
2018-10-01 22:35:31
阅读次数:
174
在 Github 上,afshinea 贡献了一个备忘录对经典的斯坦福 CS229 课程进行了总结,内容包括监督学习、无监督学习,以及进修所用的概率与统计、线性代数与微积分等知识。 项目地址:https://github.com/afshinea/stanford-cs-229-machine-le ...
分类:
其他好文 时间:
2018-10-01 10:40:52
阅读次数:
184