码迷,mamicode.com
首页 >  
搜索关键字:相似度    ( 854个结果
动态规划——最长公共子串
引入:最长公共子序列常用于解决字符串的相似度问题。最长公共子序列(LongestCommonSubsequence,LCS)与最长公共字串(LongestCommonSubstring):子串是串的一个连续的部分,子序列则是从不改变序列顺序,而从序列中去掉任意多个元素而获得的新的序列;也就是说,子串...
分类:其他好文   时间:2014-07-22 23:12:35    阅读次数:357
机器学习实战-k-近邻算法
k-近邻算法原理:存在一个样本的数据集合,也叫训练的样本集,样本集中每个数据都有标签,算法分类时,输入没有分类的新数据,将新数据的每个特征与样本集中每个数据对应的特征进行比较,然后样本集可以计算得到与新数据的相似度,然后取前k(通常不大于20)大相似度所对应的类标签,然后将新数据标识为k个中类标签最...
分类:其他好文   时间:2014-05-15 07:42:07    阅读次数:401
OpenCV2马拉松第12圈——直方图比较
收入囊中 使用4种不同的方法进行直方图比较 葵花宝典 要比较两个直方图, 首先必须要选择一个衡量直方图相似度的对比标准。也就是先说明要在哪个方面做对比。 我们可以想出很多办法,OpenCV采用了以下4种 公式也都不难,我们自己就能实现。 d越小,表示差异越低,两幅图像越接近,越相似 初识API C++: double compar...
分类:其他好文   时间:2014-05-11 03:21:18    阅读次数:411
文档内容相似项处理-Shingling
集合的Jaccard相似度定义:对于两个集合A和B,A和B的Jaccard相似度记为SIM(A,B)=|A∩B|/|A∪B|。 计算文档内容的相似度可以用来检测文档抄袭作弊或者镜像页面等。 为了计算文档内容之间的相似度,首先也将文档进行分词处理,然后计算Jaccard相似度。 shingling用来处理文档内容的分词,需要考虑shingle的大小。 例如,字符串“abcd" , 2个shi...
分类:其他好文   时间:2014-05-09 00:41:45    阅读次数:290
854条   上一页 1 ... 84 85 86
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!