搜索关键字：相似度，搜索到854个结果！码迷,mamicode.com！

public static double SimilarityNoContains(string a, string b) { string a1 = ""; string b1 = ""; if (a=...

分类：其他好文时间：2015-06-08 17:12:53 阅读次数：117

如果两个文件相似度很高，那么上下文格式的diff，将显示大量重复的内容，很浪费空间。1990年，GNU diff率先推出了"合并格式"的diff，将f1和f2的上下文合并在一起显示。它的使用方法是加入u参数（代表unified）。 $ diff -u f1 f2显示结果如下： --- f1 20.....

分类：其他好文时间：2015-06-07 20:12:09 阅读次数：123

聚类分析

聚类（clustering）就是将数据集划分为由若干相似实例组成的簇（cluster）的过程，使得同一个簇中实例间的相似度最大化，不同簇的实例间的相似度最小化。聚类分析的方法主要有： 1）划分的方法 2）层次的方法 3）基于密度的方法 4）基于网格的方法 5）基于模型的方法。。。 w...

分类：其他好文时间：2015-06-04 15:17:02 阅读次数：109

谱聚类--SpectralClustering

谱聚类一般会先对两两样本间求相似度，然后根据相似度矩阵求出拉普拉斯矩阵，然后将每个样本映射到拉普拉斯矩阵特诊向量中，最后使用k-means聚类。 scikit-learn开源包中已经有现成的接口可以使用，具体见 http://scikit-learn.org/dev/modules/generated/sklearn.cluster.SpectralClustering.html#sklea...

分类：其他好文时间：2015-06-02 21:59:56 阅读次数：219

相似度计算map-reduce实现思路

相似度计算map-reduce实现思路输入： 1 f(1) 2 f(2) 3 f(3) 4 f(4) mapper: 1,2 f(1) 1,3 f(1) 1,4 f(1) 1,2 f(2) 2,3 f(2) 2,4 f(2) 1,3 f(3) 2,3 f(3) 3,4 f(3) 1,4 f(4) 2,4 f(4) 3,4 f(4)...

分类：其他好文时间：2015-05-31 18:32:49 阅读次数：98

利用word分词提供的文本相似度算法来辅助记忆英语单词

本文实现代码：利用word分词提供的文本相似度算法来辅助记忆英语单词本文使用的英语单词囊括了几乎所有的考纲词汇共18123词： /** ?*?考纲词汇 ?*?@return ?*/ public?static?Set<Word>?getSyllabusVoca...

分类：编程语言时间：2015-05-29 14:09:38 阅读次数：199

海量数据相似度计算之simhash和海明距离

通过?采集系统?我们采集了大量文本数据，但是文本中有很多重复数据影响我们对于结果的分析。分析前我们需要对这些数据去除重复，如何选择和设计文本的去重算法？常见的有余弦夹角算法、欧式距离、Jaccard相似度...

分类：其他好文时间：2015-05-28 18:29:58 阅读次数：159

Mahout:采用斯皮尔曼相关系数基于相对排名定义相似度

采用斯皮尔曼相关系数基于相对排名定义相似度...

分类：其他好文时间：2015-05-27 21:12:57 阅读次数：180

基于谷本系数计算相似度

//这段程序写的是忽略偏好值基于谷本系数计算相似度 //这个算法是基于谷本系数。 //这个值也叫做Jaccard系数，由两个用户共同表达过偏好的物品数目除以至少 //一个用户表达过偏好的物品数目而得（就是两者得交集除以两者得并集） package byuser; import java.io.File; import java.io.IOException; import org.apache...

分类：其他好文时间：2015-05-27 21:10:24 阅读次数：638

共854条上一页 1 ... 63 64 65 66 67 ... 86 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)