码迷,mamicode.com
首页 >  
搜索关键字:相似度    ( 854个结果
关于Jaccard相似度在竞品分析中的一点思考
上个月对一个小项目的效果进行改进,时间紧,只有不到一周的时间,所以思考了一下就用了最简单的方法来做,跟大家分享一下(项目场景用的类似的场景) 项目场景:分析一个产品的竞品,譬如app的竞品、网站的竞品等等 项目分析:简单来说就是竞品分析,竞品分析有很多比较成熟的方法,但是我认为,竞品分析其实和推荐有 ...
分类:其他好文   时间:2017-09-11 15:18:26    阅读次数:156
利用谱聚类算法解决非完全图的聚类
在处理非完全图的聚类时候,很难找到一个有效的聚类算法去做聚类。 对于下图来说,10号点和15号点的位置相隔并不是那么近,如用普通聚类算法对下图做聚类,通常会把10号点和15号点聚在一个类上,所以一般的聚类效果并没有那么好。 而谱聚类,就很能很好的处理这类问题。 下面我们来重点介绍谱聚类 谱聚类(Sp ...
分类:编程语言   时间:2017-09-07 13:41:29    阅读次数:325
elasticsearch使用More like this实现基于内容的推荐
基于内容的推荐通常是给定一篇文档信息,然后给用户推荐与该文档相识的文档。Lucene的api中有实现查询文章相似度的接口,叫MoreLikeThis。Elasticsearch封装了该接口,通过Elasticsearch的More like this查询接口,我们可以非常方便的实现基于内容的推荐。 ...
分类:其他好文   时间:2017-09-05 17:53:10    阅读次数:236
最短编辑距离算法实现
一,算法介绍 在CS124课程的第一周提到 求解两个字符串相似度的算法 Minimum Edit Distance(最短编辑距离)算法。该算法在NLP(自然语言处理)中也会用到。 如何定义相似度呢?任给两个字符串X 和Y,使用以下三种操作将 字符串X 变到 字符串Y :①插入(Insert)操作;② ...
分类:编程语言   时间:2017-09-02 18:05:35    阅读次数:228
文本去重算法——simhash简介
一、基本概念 simhash是为了计算一篇文档之间的相似度存在的,通过simhash算法可以计算出文档的simhash值,通过各个文档计算出的二进制值来计算文档之间的汉明距离,然后根据汉明距离来比较文档之间的相似度。汉明距离是指两个相同长度的字符串相同位置上不同的字符的个数。 simhash算法分为 ...
分类:编程语言   时间:2017-08-31 16:03:58    阅读次数:135
图片相似度——hash算法简介
一、均值hash 均值hash方法是对每幅图片生成一个“指纹”字符串,然后通过比较不同图片的指纹来确定图片的相似性,比较结果越接近,则说明图片越相似。 计算均值hash的步骤。 1、缩小尺寸 去除高频和细节的最快方法是缩小图片,将图片缩小到8x8的尺寸,总共64个像素。不要保持纵横比,只需将其变成8 ...
分类:编程语言   时间:2017-08-31 16:02:41    阅读次数:201
Levenshtein Distance莱文斯坦距离算法来计算字符串的相似度
转 理解起来不难,但是很实用。 核心公式就是下面: (1) 1.百度百科介绍: Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。 许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。 编辑距离的算法是首先由俄国科学家L ...
分类:编程语言   时间:2017-08-30 11:06:14    阅读次数:158
距离最远的牛
所以说oj上总是不会没了牛 所以我们就可以看出john和他的奶牛是多么活泼了,上一个这么活泼的是蓝精灵和格格巫…..不管怎么讲题还是要写的,那么下面我们就看看这道题的解题思路。 简单的二维题基本,枚举每头奶牛的位置,计算出他们之间的距离,求最大的值,并记录此时奶牛的编号,和奶牛的相似度类似,可参考奶 ...
分类:其他好文   时间:2017-08-29 14:28:29    阅读次数:114
原创:Siamese LSTM解决句子相似度(理论篇)
nlp中语义理解一直是业内的难题。汉语不同于英语,同样一个意思,可以有很多种说法,比如你是谁的问题,就可以有如下几种:①你是谁?②你叫什么名字?③您贵姓?④介绍一下你自己 等等。这些句子在语义上是十分接近的,如果做一个智能音响,对音响说出上述任何一句,其结果不应该因为句子形式的不同而不同,也就是说训 ...
分类:其他好文   时间:2017-08-25 01:05:28    阅读次数:2998
iOS图片相似度比较
1. 缩小尺寸:将图像缩小到8*8的尺寸,总共64个像素。这一步的作用是去除图像的细节,只保留结构/明暗等基本信息,摒弃不同尺寸/比例带来的图像差异; 注:实际操作时,采取了两种尺寸作对比(10*10,100*100)尺寸再大的话就会性能影响就会较大了,我实现了两种,目的是为了展示怎么设定不同尺寸。 ...
分类:移动开发   时间:2017-08-23 18:14:20    阅读次数:188
854条   上一页 1 ... 34 35 36 37 38 ... 86 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!