一、特征提取Feature Extraction: · SIFT [1] [Demo program][SIFT Library] [VLFeat] · PCA-SIFT [2] [Project] · Affine-SIFT [3] [Project] · SURF [4] [OpenSURF] ...
分类:
其他好文 时间:
2018-05-21 14:26:01
阅读次数:
200
https://blog.csdn.net/lujiandong1/article/details/52658675 几年来,机器学习和数据挖掘非常火热,它们逐渐为世界带来实际价值。与此同时,越来越多的机器学习算法从学术界走向工业界,而在这个过程中会有很多困难。数据不平衡问题虽然不是最难的,但绝对是 ...
分类:
其他好文 时间:
2018-05-18 20:07:17
阅读次数:
148
工作原理: 分类算法。 输入未标记的新样本时,用算法提取训练样本集中和待分类的样本最近邻的K个分类标签(比如样本只有两个特征,在二维坐标系中用点来表示一个样本,选择和新样本点距离最近的K个点)。选取这k个分类标签中出现次数最多的分类,作为新数据的分类。 ...
分类:
编程语言 时间:
2018-05-18 17:12:50
阅读次数:
145
K近邻算法。 KNN算法非常简单,非常有效。 KNN的模型表示是整个训练数据集。 对一个新的数据点进行了预测,通过对K个最类似的实例(邻居)的整个训练集进行搜索,并对这些K实例的输出变量进行汇总。对于回归问题,这可能是平均输出变量,用于分类问题,这可能是模式(或最常见的)类值。 诀窍在于如何确定数据 ...
分类:
其他好文 时间:
2018-05-18 00:34:19
阅读次数:
170
分布图 PCA图 画PCA,还是推荐scater,速度很快,一般的R包真是慢到你难以想象。 Scatterplot with marginal boxplots 在散点图的侧边画箱线图,可以在一张图上提供最多的信息。教程1,教程2. 教程 ...
分类:
其他好文 时间:
2018-05-16 15:24:39
阅读次数:
157
k-近邻算法采用测量不同特征值之间的距离方法(上面写的公式)进行分类。 优点:精度高、对异常值不敏感、无数据输入假定。 缺点:计算复杂度高、空间复杂度高。 原理:1.存在一个训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。 2.输入没有标签的新数据后,将新 ...
分类:
其他好文 时间:
2018-05-14 23:05:15
阅读次数:
409
1、基本思想: 主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一。在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用。 PCA顾名思义,就是找出数据里最主要的方面,用数据里最主要的方面来代替原始数据。 第一种解释是样本点到这个直线的距离 ...
分类:
其他好文 时间:
2018-05-14 18:13:36
阅读次数:
540
定义:通过函数指针来实现函数调用的东西,函数指针参考随笔《函数指针》 好处:通过指针函数的形式,同一类型函数可以有不同实现,调用方可以选择调用不同实现。 主要有两种方式: 方式一:通过命名方式 方式二:直接通过函数指针 ...
分类:
其他好文 时间:
2018-05-13 15:37:05
阅读次数:
163
【原创】Liu_LongPo 转载请注明出处 【CSDN】http://blog.csdn.net/llp1992 PCA算法前面在前面的博客中已经有介绍,这里简单在描述一下,更详细的PCA算法请参考我的博客: 机器学习实战ByMatlab(二)PCA算法 PCA 的主要计算步骤 1.数据预处理,使 ...
分类:
其他好文 时间:
2018-05-13 11:57:10
阅读次数:
185
原文地址:http://blog.csdn.net/hjimce/article/details/50864602 作者:hjimce 一、相关理论 白化这个词,可能在深度学习领域比较常遇到,挺起来就是高大上的名词,然而其实白化是一个比PCA稍微高级一点的算法而已,所以如果熟悉PCA,那么其实会发现 ...
分类:
其他好文 时间:
2018-05-13 11:54:09
阅读次数:
122