数据稀疏问题严重制约着协同过满推荐系统的发展。对于大型商务网站来说,由于产品和用户数量都很庞大,用户评分产品一般不超过产品总数的1%,两个用户共同评分的产品更是少之又少,解决数据稀菊问题是提高推荐质量的关键。 为了提高推荐质量,许多研究人员都试图缓和数据稀疏问题。他们从不同的角度对用户和产品信息进行 ...
分类:
其他好文 时间:
2018-09-11 12:17:50
阅读次数:
415
1. 什么是FM? FM即Factor Machine,因子分解机。 2. 为什么需要FM? 1、特征组合是许多机器学习建模过程中遇到的问题,如果对特征直接建模,很有可能会忽略掉特征与特征之间的关联信息,因此,可以通过构建新的交叉特征这一特征组合方式提高模型的效果。 2、高维的稀疏矩阵是实际工程中常 ...
分类:
编程语言 时间:
2018-09-08 19:21:41
阅读次数:
415
Description 最近实验室正在为其管理的超级计算机编制一套任务管理系统,而你被安排完成其中的查询部分。超级计算机中的任务用三元组$(S_i,E_i,P_i)$描述,$(S_i,E_i,P_i)$表示任务从第$S_i$秒开始,在第$E_i$秒后结束(第$S_i$秒和$E_i$秒任务也在运行), ...
分类:
其他好文 时间:
2018-09-05 18:04:04
阅读次数:
177
AtCoder Regular Contest 102 C Triangular Relationship 题意: 给出n,k求有多少个不大于n的三元组,使其中两两数字的和都是k的倍数,数字可以重复。 分析: 思考什么样的三个数可以满足这样的要求,当然这三个数都是k的倍数的时候是可以满足的,还有就是 ...
分类:
其他好文 时间:
2018-09-03 00:00:52
阅读次数:
191
对于知识图谱的关注可以分为两个方面:知识图谱的构建和基于知识图谱数据结构的应用。知识图谱的构建主要关注如何整合结构化、非结构化的数据,实现用统一的语义数据结构如三元组RDF形式的数据存储。基于知识图谱的应用主要关注如何从这种语义数据结构中挖掘、发现、推演出相关的隐藏知识或新知识或者实现更上层的应用如 ...
分类:
其他好文 时间:
2018-09-02 11:33:42
阅读次数:
389
hdfs名词解释: Block: 在hdfs中文件都是采用分块的方式存储,每个block放在不同的DataNode上,block标识是一个三元组(block ID,numBytes,generationStamp),blockID是唯一的,具体分配由namenode节点设置,然后再由DataNode ...
分类:
其他好文 时间:
2018-08-30 18:28:02
阅读次数:
245
那些零元素数目远远多于非零元素数目,并且非零元素的分布没有规律的矩阵称为稀疏矩阵(sparse matrix)。 不同类型的矩阵有不同的压缩方式,比如对角矩阵只存储对角元素即可。要想充分压缩,就要找到数据的特点。 压缩算法也有很多种,如:音频压缩算法、视频压缩算法、通用压缩算法。不同压缩算法有不同的 ...
分类:
其他好文 时间:
2018-08-30 01:58:45
阅读次数:
259
题目链接 https://cn.vjudge.net/problem/UVA 10603 分析 经典的倒水问题,直接BFS. 对于喜闻乐见的状态判重,一开始想来个哈希函数把一个三元组映射成一个数,后面发现数据很小直接三维数组,后面又发现总水量是固定值,直接二维$bool$数组就好了 然后每次取出状态 ...
分类:
其他好文 时间:
2018-08-27 23:23:36
阅读次数:
275
上接 "梯度寻优" 扩展: "机器学习中的几个概念的关系" "梯度相关代码" 逐次逼近法 问题 1: $Ax = b$ 对于问题 1, 当 $A$ 的阶数很大, 且零元素很多的大型稀疏矩阵方程组, 使用主元消去法求解将是一个很大的挑战. 为此, 逐次逼近法 (或称为 迭代法 ) 应运而生. 下面我们 ...
分类:
其他好文 时间:
2018-08-18 18:35:58
阅读次数:
141
"题目传送 HDU3038" 题意: 你有一个长度为$n$的序列$A$,其中元素可正可负,但你不知道具体值 给你m个三元组$(a,b,c)$,表示$\sum_{i=a}^ba_i=c$ 问有多少个是错的,即与之前的限制矛盾的 如果一个限制被判为不合法,则其不产生影响 $n \le 200000,m ...
分类:
其他好文 时间:
2018-08-12 21:50:50
阅读次数:
154