自编码器是什么? 自编码器本身就是一种BP神经网络。它是一种无监督学习算法。 我们都知道神经网络能够从随意精度逼近随意函数,这里我们让神经网络目标值等于输出值x,也就是模拟一个恒等函数: 太无聊了,是吗?输入等于输出,这网络有什么意义?可是。当我们把自编码神经网络增加某些限制,事情就发生了变化。如图 ...
分类:
其他好文 时间:
2017-06-09 20:17:37
阅读次数:
158
在我们设计无监督学习模型时,应尽量做到 无监督学习的目标是为有监督模型提供初始化的参数,理想情况是“这些初始化的参数能够极大提高后续有监督模型准确率,即使有监督任务的训练样本数很少”。类别理解就是,我们在Imagenet上通过有监督的方式训练得到了表达能力很强的网络,在我们迁移至新的任务时(该任务带 ...
分类:
其他好文 时间:
2017-06-07 00:49:48
阅读次数:
173
一、机器学习介绍 什么是机器学习?计算机程序从经验E(给一些样本数据)中学习任务T,用度量P来衡量性能,并且由P定义的关于T的性能会随着经验E而提高 机器学习分为:有监督学习(给出数据样本的标签)、无监督学习(没有给出数据样本的标签)、半监督学习(给出少量的有标签数据,和大量没有标签的数据)、强化学 ...
分类:
其他好文 时间:
2017-06-06 23:24:41
阅读次数:
234
DBSCAN方法及应用 1.DBSCAN密度聚类简介 DBSCAN 算法是一种基于密度的聚类算法: 1.聚类的时候不需要预先指定簇的个数 2.最终的簇的个数不确定DBSCAN算法将数据点分为三类: 1.核心点:在半径Eps内含有超过MinPts数目的点。 2.边界点:在半径Eps内点的数量小于Min ...
分类:
数据库 时间:
2017-06-04 22:53:20
阅读次数:
492
K-means方法及其应用 1.K-means聚类算法简介: k-means算法以k为参数,把n个对象分成k个簇,使簇内具有较高的相似度,而簇间的相似度较低。主要处理过程包括: 1.随机选择k个点作为初始的聚类中心。 2.对于剩下的点,根据其与聚类中心的距离,将其归入最近的簇。 3.对每个簇,计算所 ...
分类:
其他好文 时间:
2017-06-04 20:05:34
阅读次数:
609
无监督学习 1.无监督学习的目标: 利用无标签的数据学习数据的分布或数据与数据之间的关系被称为无监督学习。 1.有监督学习和无监督学习的最大区别在于数据是否有标签 2.无监督学习最常应用的场景是聚类(clustering)和降维(Dimension Reduction) 2.聚类(clusterin ...
分类:
其他好文 时间:
2017-06-04 18:43:10
阅读次数:
332
一、K近邻方法(KNeighborsClassifier) 使用方法同kmeans方法,先构造分类器,再进行拟合。区别是Kmeans聚类是无监督学习,KNN是监督学习,因此需要划分出训练集和测试集。 直接贴代码。 K-NN可以看成:有那么一堆你已经知道分类的数据,然后当一个新数据进入的时候,就开始跟 ...
分类:
其他好文 时间:
2017-06-03 11:28:13
阅读次数:
300
前言 在企业安全建设专题中偶尔有次提到算法的应用,不少同学想深入了解这块,所以我专门开了一个子专题用于介绍安全领域经常用到的机器学习模型,从入门级别的SVM、贝叶斯等到HMM、神经网络和深度学习(其实深度学习可以认为就是神经网络的加强版)。 关联规则挖掘 关联规则挖掘通常是无监督学习,通过分析数据集 ...
分类:
编程语言 时间:
2017-05-15 10:04:14
阅读次数:
319
前言 在企业安全建设专题中偶尔有次提到算法的应用,不少同学想深入了解这块,所以我专门开了一个子专题用于介绍安全领域经常用到的机器学习模型,从入门级别的SVM、贝叶斯等到HMM、神经网络和深度学习(其实深度学习可以认为就是神经网络的加强版)。 关联规则挖掘 关联规则挖掘通常是无监督学习,通过分析数据集 ...
分类:
编程语言 时间:
2017-05-15 00:34:11
阅读次数:
209
一、监督学习 知道数据输入的同时还知道数据的标记。就相当于告诉你题目的同时还告诉你答案,让你在这种环境下学习,称之为监督学习。 其中这几种类别的硬币已经被各种不同的颜色所标示好。 二、无监督学习 没有标示(就是没有输出y)的问题,就是不告诉你题目的正确答案让你自己去寻找,最常见的是聚类或者叫分群 三 ...
分类:
其他好文 时间:
2017-05-08 20:58:48
阅读次数:
158