SVD(singular value decomposition),翻译成中文就是奇异值分解。SVD的用处有很多,比如:LSA(隐性语义分析)、推荐系统、特征压缩(或称数据降维)。SVD可以理解为:将一个比较复杂的矩阵用更小更简单的3个子矩阵的相乘来表示,这3个小矩阵描述了大矩阵重要的特性 Apri ...
分类:
编程语言 时间:
2018-12-28 15:26:29
阅读次数:
219
斯坦福机器学习课程汇总 前言首先感谢吴恩达建立Coursera这样一个优秀的在线学习平台,以及他发布在这个平台上的机器学习课程。 这门课程将整个机器学习领域的基础知识,用浅显易懂的方式,深入浅出的进行了介绍。使得一个拥有高中数学知识的学生也能听得明白。 如果你想要涉足机器学习、人工智能领域,或者对这 ...
分类:
其他好文 时间:
2018-12-28 13:33:54
阅读次数:
251
sklearn是python的重要机器学习库,其中封装了大量的机器学习算法,如:分类、回归、降维以及聚类;还包含了监督学习、非监督学习、数据变换三大模块。sklearn拥有完善的文档,使得它具有了上手容易的优势;它内置了大量的数据集,节省了获取和整理数据集的时间。因而,使其成为了广泛应用的重要的机器 ...
分类:
编程语言 时间:
2018-12-25 13:15:04
阅读次数:
203
数据集来源:https://www.kaggle.com/psparks/instacart-market-basket-analysis 思路: 实例代码: 运行结果: 从结果中可以看出数据的维数降到了27 ...
分类:
其他好文 时间:
2018-12-25 01:02:19
阅读次数:
380
目的: 使用主成分分析,将数据降维,并尽量减少各个数据之间的相关性 主成分分析主要就是把有相关性的特征合并到一起 做法: 求出数据的协方差矩阵Σ 求出Σ的特征向量(λ1,λ2,,,,,,λn) 求出λi对应的特征向量Ui Ui就是第i个主成分的系数了,,,,第i个主成分就是Ui * X 第i个主成分 ...
分类:
其他好文 时间:
2018-12-23 20:01:51
阅读次数:
144
简单的特征脸识别实验 实现特征脸的过程其实就是主成分分析(Principal Component Analysis,PCA)的一个过程。关于PCA的原理问题,它是一种数学降维的方法。是为了简化问题。在二维的坐标空间内,找到一个单位向量U,使得所有数据在U上的投影之和最大。这样就能把数据分的尽可能的开 ...
分类:
编程语言 时间:
2018-12-22 16:44:29
阅读次数:
211
1.机器学习概述 1.什么是机器学习: 2.为什么需要机器学习: 3.机器学习应用场景 2.数据来源和类型 1.数据来源 2.数据类型 3.可用数据集 ...
分类:
其他好文 时间:
2018-12-20 20:30:59
阅读次数:
166
问题情境 一个2*2的迷宫,一个入口,一个出口,还有一个陷阱。如图 这是一个二维的问题,不过我们可以把这个降维,变为一维的问题。 0.相关参数 1.状态集 探索者的状态,即其可到达的位置,有4个。所以定义 那么,在某个状态下执行某个动作之后,到达的下一个状态如何确定呢? 2.动作集 探索者处于每个状 ...
分类:
编程语言 时间:
2018-12-18 11:00:19
阅读次数:
271
一、自编码器:降维【无监督学习】 PCA简介:【线性】原矩阵乘以过渡矩阵W得到新的矩阵,原矩阵和新矩阵是同样的东西,只是通过W换基。 自编码: 自编码和PCA的区别: 由于神经网络能够学习非线性关系,因此可以认为这是PCA更有力(非线性)的泛化。而PCA试图发现描述原始数据的低维超平面,自编码器则能 ...
分类:
Web程序 时间:
2018-12-12 22:10:26
阅读次数:
368
在我们开始之前,先看一个问题:如果你要为以下案例选择一种降维技术,你会怎么选? 1. 你的系统可以使用余弦相似度测量距离,但你需要将其可视化,以便不懂技术的董事会成员也能理解,这些人可能甚至从来没听说过余弦相似度;你会怎么做? 2. 你有必要将数据的维度压缩到尽可能最低,你的限制是要保留大约 80% ...
分类:
其他好文 时间:
2018-12-11 15:51:26
阅读次数:
294