码迷,mamicode.com
首页 >  
搜索关键字:相似度    ( 854个结果
SQL Server对比两字段的相似度(函数算法)
原文:SQL Server对比两字段的相似度(函数算法)相似度函数 概述 比较两个字段的相似度 最近有人问到关于两个字段求相似度的函数,所以就写了一篇关于相似度的函数,分别是“简单的模糊匹配”,“顺序匹配”,“一对一位置匹配”。在平时的这种函数可能会需要用到,可能业务需求不一样,这里只给出参照,实际...
分类:数据库   时间:2014-11-10 11:47:27    阅读次数:272
《BI那点儿事》数据流转换——模糊查找转换
BI项目中经常会有一些提取,转换,数据处理(ELT)的工作,其中最主要的是处理过赃数据。假设在项目中我们向数据库中注入了测试数据,但是通过一个外键从另外一个表中载入数据的时候没有对应的数据,那么这一行就是赃数据。这时候可以使用SQL中的Sound-Ex,full-text,相似度算法等方法查找。这种...
分类:其他好文   时间:2014-11-07 18:53:37    阅读次数:308
word2vec生成词向量原理
假设每个词对应一个词向量,假设:1、两个词的相似度正比于对应词向量的乘积。即:$sim(v_1,v_2)=v_1\cdot v_2$。即点乘原则;2、多个词$v_1~v_n$组成的一个上下文用$C$来表示,其中$C=\sum_{i=1}^{n}v_i$。即加和原则;
分类:其他好文   时间:2014-11-07 14:48:49    阅读次数:801
图像检索中相似度度量公式:各种距离(1)
图像检索中相似度度量公式:各种距离...
分类:其他好文   时间:2014-11-06 14:54:52    阅读次数:326
POJ 1080 Human Gene Functions(求两字符串相似度:LCS变形)
POJ 1080 Human Gene Functions(求两字符串相似度:LCS变形) http://poj.org/problem?id=1080 题意: 给你两个由字符A,C,G,T构造的字符串s1和s2, 现在你可以在这两个字符串中插入空格, 使得两串长相等(但是不能使得s1的空格对应s2的空格位置). 然后给你s1的特定字符对应s2中特定字符所能获得的分数矩阵: 问你最后两个字符串所能获得的最大分数是多少? 分析: 本题很类似于求字符串最短编辑距离或者求...
分类:其他好文   时间:2014-11-04 17:35:43    阅读次数:187
HDU 1080 DP
匹配两个人相似度。A,G,C,T,每两个都会有一个对应的值,给出两串基因,长度可以不一样,可以在基因中间加_使两串长度一样,然后有一个对应值,求最大对应值。 先做出对应的表 DP方程: x=dp[i-1][j-1]+hash[str_a[i-1]][str_b[j-1]]; y=dp[i-1][j]+hash[str_a[i-1]]['-']; z=dp[i][j-1]+hash[str...
分类:其他好文   时间:2014-11-03 22:37:30    阅读次数:252
编辑距离及汉明距离的php实现
在计算字符串或图形的相似度时,常用的两个算法,一个是编辑距离,另一个是汉明距离。简单点说:编辑距离是通过几次编辑能把一个字符串变成另一个字符串汉明距离是对应位置进行比较,找出不同的字符个数想了解详情的请自行搜索。以下是他们的php代码实现。<?php /** *计算编..
分类:Web程序   时间:2014-10-30 11:55:53    阅读次数:742
Mahout中相似度计算方法介绍
在现实中广泛使用的推荐系统一般都是基于协同过滤算法的,这类算法通常都需要计算用户与用户或者项目与项目之间的相似度,对于数据量以及数据类型不 同的数据源,需要不同的相似度计算方法来提高推荐性能,在mahout提供了大量用于计算相似度的组件,这些组件分别实现了不同的相似度计算方法。下图用 于实现相似度计...
分类:其他好文   时间:2014-10-29 10:23:18    阅读次数:222
DNN深度神经网络对齐
1. 论文【1】中使用了DNN的思想进行对齐,对齐所需训练数据来自HMM和IBM Model4,算上输入层一共是四层结构,见下图: 效果好于原始的HMM和IBM4,见下图: 该思路可以用在许多地方,诸如:片段相似度、句子相似度、翻译概率、词向量等计算上。 不过,实际应用的话,DNN...
分类:其他好文   时间:2014-10-25 13:12:21    阅读次数:774
基于KNN的newsgroup 18828文本分类器的Python实现
还是同前一篇作为学习入门。1. KNN算法描述:step1: 文本向量化表示,计算特征词的TF-IDF值step2: 新文本到达后,根据特征词确定文本的向量step3 : 在训练文本集中选出与新文本向量最相近的k个文本向量,相似度度量采用“余弦相似度”,根据实验测试的结果调整k值,此次选择20ste...
分类:编程语言   时间:2014-10-23 12:14:28    阅读次数:403
854条   上一页 1 ... 75 76 77 78 79 ... 86 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!