一.监督学习和无监督学习 1.监督学习,就是人们常说的分类,通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的,也就具有了对未知数 ...
分类:
其他好文 时间:
2017-07-27 16:37:23
阅读次数:
189
聚类 聚类任务 在无监督学习(密度估计、异常检测等)中,训练样本的标记信息是未知的(即不人为指定),旨在发现数据之间的内在联系和规律,为进一步的数据分析提供基础。 此类学习任务中研究最多、应用最广的是聚类。 聚类将数据集中的样本划分为若干个通常是不相交(有的时候会相交)的子集(簇,也叫类),即将样本 ...
分类:
其他好文 时间:
2017-07-26 17:36:00
阅读次数:
197
监督学习:分类和回归属于监督学习。这类算法必须知道预测什么,即目标变量的分类信息。 常见算法:k-近邻算法、线性回归、朴素贝叶斯算法、支持向量机、决策树、Lasso最小回归系数估计、Ridge回归、局部加权线性回归 无监督学习:数据没有类别信息,不给定目标值。 常见算法:K-均值、最大期望算法、DB ...
分类:
其他好文 时间:
2017-07-24 16:30:08
阅读次数:
116
在无监督学习中,我们很少或者根本不知道结果是什么样子。我们可以根据数据中变量之间的关系对数据进行聚类,无监督学习没有基于预测结果的反馈。 例子: 聚类:收集1000000个不同的基因,并找到一种方法,自动将这些基因分成不同的变量组,如寿命、位置、角色等。非聚类:“鸡尾酒会算法”,让你在混乱的环境中找 ...
分类:
其他好文 时间:
2017-07-22 22:25:45
阅读次数:
112
传统机器学习依赖良好的特征工程。深度学习解决有效特征难人工提取问题。无监督学习,不需要标注数据,学习数据内容组织形式,提取频繁出现特征,逐层抽象,从简单到复杂,从微观到宏观。 稀疏编码(Sparse Coding),基本结构组合。自编码器(AutoEncoder),用自身高阶特征编码自己。期望输入/ ...
分类:
其他好文 时间:
2017-07-10 00:33:22
阅读次数:
283
KPCA,中文名称”核主成分分析“,是对PCA算法的非线性扩展,言外之意,PCA是线性的,其对于非线性数据往往显得无能为力,例如,不同人之间的人脸图像,肯定存在非线性关系,自己做的基于ORL数据集的实验,PCA能够达到的识别率只有88%,而同样是无监督学习的KPCA算法,能够轻松的达到93%左右的识 ...
分类:
其他好文 时间:
2017-06-28 20:27:29
阅读次数:
267
************************************** 注:本系列博客是博主学习Stanford大学 Andrew Ng 教授的《机器学习》课程笔记。博主深感学过课程后,不进行总结非常easy遗忘。依据课程加上自己对不明确问题的补充遂有此系列博客。本系列博客包含线性回归、逻辑回 ...
分类:
其他好文 时间:
2017-06-21 13:38:13
阅读次数:
169
半监督学习 顾名思义是介于分类(监督学习)与聚类(无监督学习)之间的一种学习范式。给定很少一部分样本的类标签,怎么样利用少部分具有类标签的数据来提高聚类的准确率是其研究主题。其中基于图的标签传播(Label Propagation)算法是有影响的算法之一。 UCI机器学习数据库:http://arc ...
分类:
编程语言 时间:
2017-06-17 18:36:27
阅读次数:
274
目前,机器学习的方法主要有三种:监督学习、半监督学习和无监督学习。监督学习是利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。白话一点,就是根据已知的,推断未知的。代表方法有:Nave Bayes、SVM、决策树、KNN、神经网络以及Logistic分析等; 半监督方法主要考虑如何利 ...
分类:
其他好文 时间:
2017-06-16 21:11:59
阅读次数:
275