一、用自己的话描述出其本身的含义: 1、特征选择 将高维空间的样本通过映射或者是变换的方式转换到低维空间,达到降维的目的,然后通过特征选取删选掉冗余和不相关的特征来进一步降维。 2、PCA 找出数据里最主要的方面,用数据里最主要的方面来代替原始数据 二、并用自己的话阐述出两者的主要区别 PCA是用于 ...
分类:
其他好文 时间:
2020-04-27 22:44:45
阅读次数:
56
一、用自己的话描述出其本身的含义: 1、特征选择 特征选择就是从所有特征中选择部分特征作为训练集,即对现有特征的“取其精华,去其糟粕”,特征在选择前后 可以改变值、也可以不改变值,只是选择后的特征维数肯定要比选择前小。 2、PCA PCA是一种分析、简化数据集的技术,主要是将数据的主成分(包含信息量 ...
分类:
其他好文 时间:
2020-04-27 19:31:34
阅读次数:
47
一、用自己的话描述出其本身的含义: 1、特征选择 2、PCA 答:特征选择:选择部分特征当做机器学习的相关数据。 PCA:PCA是一种分析,简化数据集的技术。,是数据维数压缩,尽可能尽可能降低原数据的维数(复杂度),损失少量信息,可以消减回归分析或聚类分析中特征的数量。 二、并用自己的话阐述出两者的 ...
分类:
其他好文 时间:
2020-04-27 19:06:50
阅读次数:
48
很容易理解的一篇博客[http://blog.codinglabs.org/articles/pca tutorial.html] 在高维情形下出现的数据样本稀疏、距离计算困难等问题,称为“维数灾难”。 缓解维数灾难的一个重要途径是降维。将原始高维属性空间转变成一个低维子空间,子空间样本密度大幅提高 ...
分类:
其他好文 时间:
2020-04-27 09:27:36
阅读次数:
163
机器学习基础:Kmeans算法及其优化 CONTENT 1. "算法原理" 2. "算法流程" 3. "算法优化" Kmeans++ Elkan Kmeans Mini Batch Kmeans 4. "与KNN的区别" 5. "算法小结" 6. "sklearn代码实践" 1. 算法原理 对于给定 ...
分类:
编程语言 时间:
2020-04-25 12:42:13
阅读次数:
78
本文始发于个人公众号: TechFlow ,原创不易,求个关注 今天是机器学习真题的第17篇文章,我们来讲讲机器学习模型的评估。 在之前的文章当中我们已经介绍了好几个模型了,有朴素贝叶斯、KNN、KMeans、EM还有线性回归和逻辑回归。今天我们来和大家聊聊该怎么评估这些模型。 均方差 这个概念很简 ...
分类:
其他好文 时间:
2020-04-22 21:27:30
阅读次数:
185
一、环境准备 JDK版本: jdk1.8; 操作系统: centos 7.6 ; Python: :3.7.7; tomcat: apache tomcat 8.5.5; 二、配置python3 2.1 python3依赖包 2.2 下载安装python3 1. 打开 "Python下载地址链接" ...
分类:
编程语言 时间:
2020-04-20 12:01:23
阅读次数:
61
关于线性判别分析算法LDA算法,可以用来降维和分类,一种监督学习策略(也就是你要指定分几类),这一点是不同于PCA的(PCA是非监督学习的)。 推荐学习网址: https://blog.csdn.net/ruthywei/article/details/83045288 https://blog.c ...
分类:
编程语言 时间:
2020-04-17 15:57:37
阅读次数:
69
前言 在用数据对模型进行训练时,通常会遇到维度过高,也就是数据的特征太多的问题,有时特征之间还存在一定的相关性,这时如果还使用原数据训练模型,模型的精度会大大下降,因此要降低数据的维度,同时新数据的特征之间还要保持线性无关,这样的方法称为主成分分析(Principal component analy ...
分类:
其他好文 时间:
2020-04-14 00:36:27
阅读次数:
70
layout: post title: "推荐算法-协同过滤推荐算法" date: 2020-4-13 9:00:00 categories: [Algorithm] excerpt: "协同过滤推荐算法简介,参考https://zhuanlan.zhihu.com/p/40463528" 协同过滤 ...
分类:
编程语言 时间:
2020-04-13 19:53:21
阅读次数:
77