降维 降维的动力来自于维度魔咒,动辄几万个甚至更多的特征会导致训练变慢,而且,维数越高越难找到合适的解决方案。特征的维数对应着相同维度的一个高维空间,高维空间中点与点的距离很容易变得很大,也就是实例之间的距离很大,训练集的特征空间很稀疏,这容易导致过拟合,当然,通过添加足够多的训练实例,在理论上可以 ...
分类:
其他好文 时间:
2019-05-25 00:04:30
阅读次数:
123
一、图的存储结构 图的数组(邻接矩阵)存储表示: 优点:1/0表示方便 缺点:不利于增加删除顶点 特殊:时间复杂度较高,不稀疏图;不过在无向图,可利用下三角形来压缩处理空间。 例子1: (需要辅助数组) 来源:https://www.cnblogs.com/XMU-hcq/p/6065057.htm ...
分类:
其他好文 时间:
2019-05-19 23:32:40
阅读次数:
211
Reference: https://github.com/NervanaSystems/distiller https://nervanasystems.github.io/distiller/index.html PART I: 介绍 Distiller模型压缩包含的算法: 稀疏算法(剪枝+正则 ...
分类:
其他好文 时间:
2019-05-19 12:26:43
阅读次数:
151
弄清楚图 本章重点 1.邻接矩阵:表示顶点之间相邻关系的矩阵 邻接矩阵表示法的特点: 优点:容易实现图的操作,如:求某顶点的度、判断顶点之间是否有边、找顶点的邻接点等等。 缺点:n个顶点需要n*n个单元存储边; 空间效率为O(n2)。对稀疏图而言尤其浪费空间。 2.邻接表 (1)图的链式存储结构 ( ...
分类:
其他好文 时间:
2019-05-19 10:09:23
阅读次数:
120
高斯函数与正态分布 高斯函数或者说正态分布函数在很多场合都得到广泛应用,其是概率论和统计学的核心,在最大似然估计、贝叶斯估计中必不可少。其也是稀疏贝叶斯估计的重要基础。下面对高斯函数的一些基本知识点进行归纳和总结,不当之处,欢迎批评指正。 (1) 高斯函数高斯函数定义如下\begin{equatio ...
分类:
其他好文 时间:
2019-05-13 09:17:03
阅读次数:
185
字典核心底层原理(重要) 字典对象的核心是散列表。散列表是一个稀疏数组(总是有空白元素的数组),数组的 每个单元叫做 bucket。每个 bucket 有两部分:一个是键对象的引用,一个是值对象的引 用。 由于,所有bucket 结构和大小一致,我们可以通过偏移量来读取指定 bucket。 一:将一 ...
分类:
编程语言 时间:
2019-05-12 01:48:05
阅读次数:
180
1.一看到这道题,就知道要用树的结构,而且我们这章学的也是树。 2.根据题目的样例试图画出树的形状 3.下一步确定树的存储结构,我们可以用邻接矩阵和结构体数组来存储;其中邻接矩阵可以很好的遍历每个门,但在这道题目中每扇门后通往的门的数量可能并不多,导致实际上出现的可能是稀疏矩阵,需要浪费大量空间。所 ...
分类:
其他好文 时间:
2019-05-05 01:21:04
阅读次数:
154
看了网上的一些用tf实现的FM,很多都没有考虑FM实际使用中数据样本稀疏的问题。 我在实现的时候使用 embedding_lookup_sparse来解决这个问题。 对于二阶部分,由于embedding_lookup_sparse没法计算 和的平方 和 平方的和,我参考embedding_looku ...
分类:
其他好文 时间:
2019-04-26 11:26:10
阅读次数:
92
Numpy介绍 编辑 一个用python实现的科学计算,包括:1、一个强大的N维数组对象Array;2、比较成熟的(广播)函数库;3、用于整合C/C++和Fortran代码的工具包;4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy配合使用更加方便。 NumPy(N ...
分类:
其他好文 时间:
2019-04-25 09:12:34
阅读次数:
205
numpy Numpy介绍 编辑 一个用python实现的科学计算,包括:1、一个强大的N维数组对象Array;2、比较成熟的(广播)函数库;3、用于整合C/C++和Fortran代码的工具包;4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy配合使用更加方便。 N ...
分类:
其他好文 时间:
2019-04-20 21:29:47
阅读次数:
247