码迷,mamicode.com
首页 >  
搜索关键字:相似度    ( 854个结果
【短文本】短文本相似度算法研究
机器学习算法与自然语言处理出品@公众号原创专栏作者刘聪NLP学校|NLP算法工程师知乎专栏|自然语言处理相关论文短文本相似度,即求解两个短文本之间的相似程度;它是文本匹配任务或文本蕴含任务的一种特殊形式,返回文本之间相似程度的具体数值。然而在工业界中,短文本相似度计算占有举足轻重的地位。例如:在问答系统任务(问答机器人)中,我们往往会人为地配置一些常用并且描述清晰的问题及其对应的回答,我们将这些配
分类:编程语言   时间:2020-11-25 12:58:27    阅读次数:18
DTW (Dynamic Time Warping) 动态时间规整
在时间序列中,需要比较相似性的两段时间序列的长度可能并不相等,比较显著的例子是在语音识别领域表现为语速不同,不同人的语速不同,同一个人说同一句话的语速也会不同,那如何计算时间序列下的相似度呢?这时候会发现欧式距离有点失效了,因为长度不一致了,这时候就出现了DTW算法,它相当于对某个时间序列在时间轴进 ...
分类:其他好文   时间:2020-11-19 12:10:49    阅读次数:3
“杀熟杀豪与互联网推荐”-架构师之路年终总结
年初花了一些笔墨写互联网常见的推荐算法,没有复杂的公式,没有晦涩的技术词汇,只有通俗的案例,每篇1分钟,保证弄懂。《从电影推荐开始,聊协同过滤》什么是协同过滤协同过滤的3步骤一张excel表格,秒懂协同过滤《从职位推荐开始,聊内容推荐》什么是基于内容的推荐基于内容的推荐的3步骤明明职位要求6000+,为啥会出3000+的推荐结果《我不是潘金莲,聊相似性推荐》没有用户行为数据,能不能做电影推荐相似度
分类:其他好文   时间:2020-11-16 13:53:59    阅读次数:6
集合相似度-easy-stl-set
#include<iostream> #include<cstdio> #include<set> #define MAXSIZE 51 using namespace std; set<int> s[MAXSIZE];/*建立set数组,自动除去重复的并且升序排好,然后利用count函数即可,知识 ...
分类:其他好文   时间:2020-11-07 16:42:41    阅读次数:18
从勾股定理到余弦相似度-程序员的数学基础
本文主要讲解余弦相似度的相关知识点。相似度计算用途相当广泛,是搜索引擎、推荐引擎、分类聚类等问题的核心点。为了理解清楚余弦相似度的来龙去脉,本文从最简单的初中数学入手,介绍余弦公式的推导过程,然后基于余弦公式串讲一些实践的例子,最后给出余弦相似度在开源搜索引擎中的使用。 ...
分类:其他好文   时间:2020-11-04 17:35:35    阅读次数:22
图片相似算法D-Hash,PHP版本
简单识别图片相似度。使用PHP实现在网上查了写资料,这里作为整理,比较高级的算法这里不讨论,这里仅仅说一下php容易实现的简单算法。算法的思路是对图片进行压缩处理,得到特征hash,然后对比hash进行监测相似度。这类算法称为:感知哈希算法,包括aHash、pHash、dHash。顾名思义,感知哈希不是以严格的方式计算Hash值,而是以更加相对的方式计算哈希值,因为“相似”与否,就是一种相对的判定
分类:编程语言   时间:2020-09-17 22:52:13    阅读次数:34
Java实现相似结构表算法
【产品需求】 对所有元数据进行分析,匹配出表字段相似度达到阈值的向相似结构表关系数据。 网上没有搜到相关算法实现,只能自己动手了。 【算法分析】 简单点实现的话,可以轮询所有表,每张表都和其它表进行匹配相似度,不过这是人干的事?如果有1W张表岂不要查询1W × 1W次? 1、先统计出相同字段、表、表 ...
分类:编程语言   时间:2020-09-17 13:22:42    阅读次数:28
数据结构与算法专题——第四题 字符串相似度
这篇我们看看最长公共子序列的另一个版本,求字符串相似度(编辑距离),我也说过了,这是一个非常实用的算法,在DNA对比,网页聚类等方面都有用武之地。一:概念对于两个字符串A和B,通过基本的增删改将字符串A改成B,或者将B改成A,在改变的过程中使用的最少步骤称之为:编辑距离。比如如下的字符串:我们通过种种操作,痉挛之后编辑距离为3,不知道你看出来了没有?二:解析可能大家觉得有点复杂,不好理解,我试着把
分类:编程语言   时间:2020-09-09 18:58:03    阅读次数:39
数据结构与算法专题——第三题 最长公共子序列
一:作用最长公共子序列的问题常用于解决字符串的相似度,是一个非常实用的算法,作为码农,此算法是我们的必备基本功。二:概念举个例子,cnblogs这个字符串中子序列有多少个呢?很显然有27个,比如其中的cb,cgs等等都是其子序列,我们可以看出子序列不见得一定是连续的,连续的那是子串。我想大家已经了解了子序列的概念,那现在可以延伸到两个字符串了,你可以看出cnblogs和belong的公共子序列吗?
分类:编程语言   时间:2020-09-09 18:57:09    阅读次数:40
基于物品协同过滤实现商品推荐系统
一、背景 某电商平台,有一批用户浏览、收藏、购买物品的日志数据。实现用户进入APP之后第一页显示商品的个性化推荐。ps:当前阶段,显示数据为随机选取。 二、思考 1、因为是某一品类的特殊电商平台,卖的商品几百种,但是用户几十万。这种情况,考虑使用ItemCF,至于为什么不是UserCF:物品相似度矩 ...
分类:其他好文   时间:2020-07-28 16:52:20    阅读次数:74
854条   上一页 1 2 3 4 ... 86 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!