1 定义画图函数,用来可视化数据分布 (注:jupyternotebook来编写的代码) 2 KNN实现 3 运行结果 ...
分类:
其他好文 时间:
2019-07-27 12:50:43
阅读次数:
112
主成分分析原理与实现 主成分分析是一种矩阵的压缩算法,在减少矩阵维数的同时尽可能的保留原矩阵的信息,简单来说就是将 $n×m$的矩阵转换成$n×k$的矩阵,仅保留矩阵中所存在的主要特性,从而可以大大节省空间和数据量。最近课上学到这个知识,感觉很有意思,就在网上找一些博客进行学 ...
分类:
其他好文 时间:
2019-07-23 23:55:56
阅读次数:
266
k邻近算法(k-nearest neighbors)是一种懒惰算法,不需要进行训练,每次对一个新的未知的数据,对所有已知的数据求欧氏距离,在小于一定距离x之内的样本进行级数,计数最多的就认为未知数据的分类。 KNN的复杂度很高,每次需要遍历所有的数据,并且将每一纬度都进行计算,而且距离x选取的不同会 ...
分类:
其他好文 时间:
2019-07-23 15:28:35
阅读次数:
109
机器学习”小憩“——总结应用场景 常见的机器学习模型:感知机,线性回归,逻辑回归,支持向量机,决策树,随机森林,GBDT,XGBoost,贝叶斯,KNN,K-means等; 常见的机器学习理论:过拟合问题,交叉验证问题,模型选择问题,模型融合问题等; K近邻:算法采用测量不同特征值之间的距离的方法进 ...
分类:
编程语言 时间:
2019-07-20 13:00:47
阅读次数:
162
前言:机器学习所使用的数据大多具有很多的特征,想要直观的对数据的分布和特征之间的关系进行观测,需要将数据的主要特征提取出来,降低到三维及三维以下的空间来展示。 PCA(主成分分析)是常用的用于降维的方法,本文通过PCA对数据进行降维,再对降维后的数据用K-means算法聚类,以达到在低维空间可直观观 ...
分类:
其他好文 时间:
2019-07-19 21:20:35
阅读次数:
141
在主成分分析(PCA)原理总结中,我们对主成分分析(以下简称PCA)的原理做了总结,下面我们就总结下如何使用scikit-learn工具来进行PCA降维。# 一、scikit-learn PCA类介绍 在scikit-learn中,与PCA相关的类都在sklearn.decomposition包中。... ...
分类:
其他好文 时间:
2019-07-19 19:03:33
阅读次数:
95
奇异值分解(Singular Value Decomposition,以下简称SVD)是在机器学习领域广泛应用的算法,它不光可以用于降维算法中的特征分解,还可以用于推荐系统,以及自然语言处理等领域。是很多机器学习算法的基石。本文就对SVD的原理做一个总结,并讨论在在PCA降维算法中是如何运用运用SV... ...
分类:
其他好文 时间:
2019-07-19 19:01:10
阅读次数:
106
主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一。在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用。一般我们提到降维最容易想到的算法就是PCA,下面我们就对PCA的原理做一个总结。# 一、PCA的思想 PCA顾名思义,就是找出数据里最... ...
分类:
其他好文 时间:
2019-07-19 18:45:47
阅读次数:
84
局部线性嵌入(Locally Linear Embedding,以下简称LLE)也是非常重要的降维方法。和传统的PCA,LDA等关注样本方差的降维方法相比,LLE关注于降维时保持样本局部的线性特征,由于LLE在降维时保持了样本的局部特征,它广泛的用于图像图像识别,高维数据可视化等领域。下面我们就对L... ...
分类:
其他好文 时间:
2019-07-19 18:41:00
阅读次数:
107