码迷,mamicode.com
首页 >  
搜索关键字:相似度    ( 854个结果
【计算语言学实验】基于 Skip-Gram with Negative Sampling (SGNS) 的汉语词向量学习和评估
一、概述 训练语料来源:维基媒体 https://dumps.wikimedia.org/backup index.html 汉语数据 用word2vec训练词向量,并用所学得的词向量,计算 pku_sim_test.txt 文件中每行两个词间的余弦距离作为两词相似度,并输出到文件中。 二、数据准备 ...
分类:编程语言   时间:2019-12-27 23:35:37    阅读次数:278
知识图谱的融合_实例层的融合和匹配
5.4.1 实例层的融合和匹配 空间复杂度挑战 时间复杂度挑战: 匹配元素对的相似度计算次数(n2) 每次相似度计算时间复杂度(t) 匹配结果质量挑战5.4.2 基于快速相似度计算的实例匹配方法 思想:降低每次相似度计算的时间复杂度,即t 映射过程只能使用简单且速度较快的匹配器,映射线索尽量简单; ...
分类:其他好文   时间:2019-12-23 19:16:36    阅读次数:184
Java根据余弦定理计算文本相似度
项目中需要算2个字符串的相似度,是根据余弦相似性算的,下面具体介绍一下: 余弦相似度计算 余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。 我们知道,对于两个向量,如果他们之间的夹角越小,那么我 ...
分类:编程语言   时间:2019-12-23 16:44:30    阅读次数:109
根据在线时间推荐好友
去年公司某RPG游戏上线,各个老板们都去组团体验,作为小弟的我们也跟风练号刷副本。没过几天,老大抛给我一个问题,说自己加了很多好友,但是想刷副本的时候,基本上没几个人在线。能不能根据玩家在线的时间段推荐相似的好友呢?推荐的本质是排序。给用户推荐用户,就是要找到一个相似度评估函数来衡量两个用户的在线时... ...
分类:其他好文   时间:2019-12-15 01:17:02    阅读次数:102
无监督学习和监督学习的区别
监督学习:给出一个训练集,然后通过训练集学习出一个模型,当新的数据到来的时候,我们就能通过这个模型进行预测结果。监督学习的训练集不仅要有输入还要有输出,即目标特征和目标结果,特征就是训练集中数据特有的,结果是人为标记的。监督学习是我们一开始就让机器知道一张图片是那个东西,如他是猪,他是狗,他是牛,机 ...
分类:其他好文   时间:2019-12-14 19:24:00    阅读次数:98
两篇文章的相似度(文章相似度)
package com.etoak.simHash; import com.hankcs.hanlp.seg.common.Term; import com.hankcs.hanlp.tokenizer.StandardTokenizer; import org.apache.commons.lan ...
分类:其他好文   时间:2019-12-14 19:21:23    阅读次数:115
用Python实现一个简单的——人脸相似度对比
近几年来,兴起了一股人工智能热潮,让人们见到了AI的能力和强大,比如图像识别,语音识别,机器翻译,无人驾驶等等。总体来说,AI的门槛还是比较高,不仅要学会使用框架实现,更重要的是,需要有一定的数学基础,如线性代数,矩阵,微积分等。 幸庆的是,国内外许多大神都已经给我们造好“轮子”,我们可以直接来使用 ...
分类:编程语言   时间:2019-12-13 10:50:17    阅读次数:117
论文阅读 | Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
简述 在文本语义相似度等句子对的回归任务上,BERT , RoBERTa 拿到sota。 但是,它要求两个句子都被输入到网络中,从而导致巨大开销:从10000个句子集合中找到最相似的sentence-pair需要进行大约5000万个推理计算(约65小时)。 BERT不适合语义相似度搜索,也不适合非监 ...
分类:Web程序   时间:2019-12-11 23:26:27    阅读次数:801
单词错误纠正功能 编辑距离 最大公共字串 两个字符串的相似度 差异度
莱文氏距离i指向a字符串中的字符j指向b字符串中的字符s[][]存储第a中第i个字符和b中第j个字符相比较后,最小的莱文氏距离值状态的转移对应2种,其中字符不相等时有3种情况1.a[i]==b[j] ,那么 i++ j++ ,距离值保持上一状态的2.a[i]!=b[j] ,需要增加距离值,那么需要考 ...
分类:其他好文   时间:2019-12-11 09:19:42    阅读次数:79
CA-RNN论文读取
***CA-RNN: Using Context-Aligned Recurrent Neural Networks for Modeling Sentence Similarity(CA-RNN:使用上下文对齐的递归神经网络建模句子相似度)*****论文通读:** ## 1. 概要: 大多数RNN ...
分类:其他好文   时间:2019-12-08 12:30:02    阅读次数:91
854条   上一页 1 ... 8 9 10 11 12 ... 86 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!