https://www.docin.com/p-1699190456.html http://www.doc88.com/p-0952897045830.html https://blog.csdn.net/qq_36919570/article/details/79991322 http://ww ...
分类:
其他好文 时间:
2019-04-19 14:39:05
阅读次数:
162
摘自推荐系统 一、描述 有一些指标是可以通过近邻算法给出的 二、指标 1、预测用户u对新物品i的评分rw。 跟用户u相似的用户称为近邻,挑选出足够多的对物品i都评分的近邻用户,然后对新物品进行评分。公式: w代表其它用户和u的相似度,r代表用户v对商品i的评分。用|w|对公式进行标准化,防止负的评分 ...
分类:
其他好文 时间:
2019-04-08 13:14:32
阅读次数:
91
1.Locality Sensitive Hashing(LSH, 局部敏感哈希) 如果我们的数据非常大,有多个对象,如果一对一对的比较,需要比较N (N 1)/2,检查每一对数据很困难。 大体思路 :用一个函数f(x, y)来判断x和y是不是一个候选对,计算候选对的相似度。 For minhash ...
分类:
其他好文 时间:
2019-03-25 20:37:12
阅读次数:
170
原文路径:https://www.learnopencv.com/histogram-of-oriented-gradients/ 按语:偶得SIFT特征匹配算法原理介绍,此文章确通俗易懂,分享之! 1.图像尺度空间 在了解图像特征匹配前,需要清楚,两张照片之所以能匹配得上,是因为其特征点的相似度较 ...
分类:
编程语言 时间:
2019-03-17 19:59:16
阅读次数:
196
前言 本套试题是用菁优网APP产生的高相似度的跟踪训练题目。 跟踪训练题 ...
分类:
其他好文 时间:
2019-03-11 13:04:04
阅读次数:
119
能干什么? 文章去重,语句去重,提取关键词(文章摘要,页面指纹),图片识别,语音识别 想要做一个相似度,最重要的是什么? 必须得到一个度量:计算个体之间的相似程度(分数,0-1之间,0代表完全不同,一代表完全一样) 相似度值越小,距离越大,相似度值越大,距离越小 两方面考虑: 文本角度 语义角度 例 ...
分类:
其他好文 时间:
2019-03-05 21:34:06
阅读次数:
410
恢复内容开始 分布式表示优势: 在一段文本当中,进行实体抽取:实际是在计算词汇与文档之间的相似度。 自动摘要技术:是在计算句子与文档之间的相似度。 优势2:由表层的数据,关联关系,能够进一步挖掘出数据底层的深层语义,因果关系。 ———————————————————————————————————— ...
分类:
其他好文 时间:
2019-02-20 21:25:09
阅读次数:
284
摘要: 两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文 ...
分类:
其他好文 时间:
2019-02-17 23:39:34
阅读次数:
273
超全数据挖掘面试笔试题(附答案) 2017年09月18日 20:31:35 SZU_ZNG 阅读数:24700 超全数据挖掘面试笔试题(附答案) 2017年09月18日 20:31:35 SZU_ZNG 阅读数:24700 超全数据挖掘面试笔试题(附答案) 超全数据挖掘面试笔试题(附答案) 2017 ...
分类:
其他好文 时间:
2019-02-06 22:27:47
阅读次数:
208
题目大意: 给定一个序列,定义两个后缀是k相似的当且仅当这两个后缀有长度为k的公共前缀。 求对任意$r\in [0,n 1]$,$r$相似的后缀的对数和两个后缀乘积的最大值。 思路: 先考虑后缀数组是如何计算两个后缀的lcp,发现是对于一段连续的height取min。 于是对于制定的相似度r,hei ...
分类:
编程语言 时间:
2019-02-06 19:48:08
阅读次数:
207