摘自:http://www.cnblogs.com/pinard/p/7160330.html 先看下列三篇,再理解此篇会更容易些(个人意见) skip-gram,CBOW,Word2Vec 词向量基础 CBOW与Skip-Gram用于神经网络语言模型 CBOW与Skip-Gram用于神经网络语言模 ...
分类:
其他好文 时间:
2018-05-15 12:19:30
阅读次数:
601
1、基本思想: 主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一。在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用。 PCA顾名思义,就是找出数据里最主要的方面,用数据里最主要的方面来代替原始数据。 第一种解释是样本点到这个直线的距离 ...
分类:
其他好文 时间:
2018-05-14 18:13:36
阅读次数:
540
数据预处理 是指因为算法或者分析需要,对经过数据质量检查后的数据进行转换、衍生、规约等操作的过程。整个数据预处理工作主要包括 五个方面内容 :简单函数变换、标准化、衍生虚拟变量、离散化、降维。本文将作展开介绍,并提供基于Python的代码实现。 1. 简单函数变换 简单函数变换 是指对原始数据直接使 ...
分类:
其他好文 时间:
2018-05-12 03:12:18
阅读次数:
174
使用5x5的卷积核仍然会带来巨大的计算量。 为此,文章借鉴NIN,采用1x1卷积核来进行降维。例如:上一层的输出为100x100x128,经过具有256个输出的5x5卷积层之后(stride=1,pad=2),输出数据为100x100x256。其中,卷积层的参数为128x5x5x256。假如上一层输 ...
分类:
其他好文 时间:
2018-05-05 11:20:19
阅读次数:
915
很久前就想写篇CDQ分治的blog了,现在填坑。 CDQ分治是一种分治算法,一般用于高维数据结构的降维。比如二维数据结构,可以通过CDQ分治变成一个一维的问题。 CDQ分治本质还是个分治。一般分治操作就是,我想知道一个长度为n的区间产生的贡献有多少,那我可以把区间平均划分成两部分,那么此时问题变成左 ...
分类:
其他好文 时间:
2018-05-01 23:35:35
阅读次数:
164
python3 学习api使用 主成分分析方法实现降低维度 使用了网络上的数据集,我已经下载到了本地,可以去我的git上参考 git:https://github.com/linyi0604/MachineLearning 代码: ...
分类:
编程语言 时间:
2018-04-30 12:02:36
阅读次数:
419
PCA主要参数: n_components:这个参数可以帮我们指定希望PCA降维后的特征维度数目whiten :判断是否进行白化,就是对降维后的数据的每个特征进行归一化svd_solver:即指定奇异值分解SVD的方法 ...
分类:
其他好文 时间:
2018-04-27 13:37:40
阅读次数:
183
(草稿) PCA主成分分析 取协方差矩阵 取矩阵特征值、特征向量 取最大特征值的特征向量 原始数据左乘特征向量,得到降维结果。 https://blog.csdn.net/sxf1061926959/article/details/53907935 ...
分类:
其他好文 时间:
2018-04-24 00:20:16
阅读次数:
181
无监督学习:着重于发现数据本身的分布特点 (不需要对数据进行标记)节省大量人力 数据规模不可限量 1 发现数据群落 数据聚类 也可以寻找 离群样本 2 特征降维 保留数据具有区分性的低维特征 这些都是在海量数据处理中非常实用的技术 数据聚类 K均值算法(预设聚类的个数 不断更新聚类中心 迭代 ,是所 ...
分类:
编程语言 时间:
2018-04-20 13:29:41
阅读次数:
321