码迷,mamicode.com
首页 >  
搜索关键字:相似度    ( 854个结果
Python 连接MongoDB并比较两个字符串相似度的简单示例
本文介绍一个示例:使用 pymongo 连接 MongoDB,查询MongoDB中的 字符串 记录,并比较字符串之间的相似度。 一,Python连接MongoDB 大致步骤:创建MongoClient > 获取 DataBase >获取Collection,代码如下: 二,Python MongoD ...
分类:数据库   时间:2017-11-25 14:22:39    阅读次数:275
距离度量以及python实现(二)
7. 夹角余弦(Cosine) 也可以叫余弦相似度。 几何中夹角余弦可用来衡量两个向量方向的差异,机器学习中借用这一概念来衡量样本向量之间的差异。 (1)在二维空间中向量A(x1,y1)与向量B(x2,y2)的夹角余弦公式: (2) 两个n维样本点a(x11,x12,…,x1n)和b(x21,x22 ...
分类:编程语言   时间:2017-11-20 21:55:10    阅读次数:356
DNA序列对齐问题
问题描述: 该问题在算法导论中引申自求解两个DNA序列相似度的问题。 可以从很多角度定义两个DNA序列的相似度,其中有一种定义方法就是通过序列对齐的方式来定义其相似度。 给定两个DNA序列A和B,对齐的方式是将空格分别插入到A和B序列中,得到具有相同长度的对齐后的序列C和D;空格可以插入到任意的位置 ...
分类:其他好文   时间:2017-11-12 21:45:02    阅读次数:150
2017年计算语义相似度最新论文,击败了siamese lstm,非监督学习
Page 1Published as a conference paper at ICLR 2017AS IMPLE BUT T OUGH - TO -B EAT B ASELINE FOR S EN -TENCE E MBEDDINGSSanjeev Arora, Yingyu Liang, Te ...
分类:其他好文   时间:2017-11-11 16:45:56    阅读次数:368
最长公共子序列(LCS)
最长公共子序列问题在算法导论中引申自确定DNA序列相似度的问题:给定两个DNA序列S1和S2,寻找第三个序列S3,要求序列S3中的元素都来源于S1和S2,且在这三个序列中先后顺序相同,但在S1和S2中不要求连续,如果找到这样的S3序列越长,可以认为S1和S2相似度越高。 问题描述: 给定两个序列X= ...
分类:其他好文   时间:2017-11-10 13:52:26    阅读次数:217
向量余弦相似度
#include <iostream>#include <vector>#include <cmath>template <typename DataType>double mycosine(typename::std::vector<DataType>& arrayA, typename::std ...
分类:其他好文   时间:2017-11-01 22:55:31    阅读次数:245
Levenshtein计算字符串的相似度
static void Main(string[] args) { Levenshtein(@"今天天气不错", @"今天的天气不错啊"); Console.Read(); } /// /// 字符串相似度计算 /// //... ...
分类:其他好文   时间:2017-11-01 14:55:45    阅读次数:161
.NET 文件格式相关开源项目
在过去的2年里,我已确定把文件格式作为我的主要研究课题之一,NPOI就是在这样的研究课题下的产物。尽管从严格意义上讲NPOI只是POI的.NET版本,并不是我创造的,但是在开发过程中,我对OLE2有了深入的理解和认识,也对Office 97-2003的文件格式有了截然不同的认识。如果在过去,有人问我 ...
分类:Web程序   时间:2017-10-31 11:07:08    阅读次数:220
身份鉴别系统
身份鉴别系统 简单来说,我们要做的就是一种通过用户敲击键盘的习惯进行身份鉴别的系统。国内外之前有一些相关研究,但是通常是数千条数据训练,而且不能随意改变敲击的字符串,或者是有的要求采用带有压力传感器的键盘,难以实用和推广。我们做一个比较简单的根据匹配相似度的系统,采用普通键盘即可使用,其算法实现很简 ...
分类:其他好文   时间:2017-10-18 14:52:07    阅读次数:153
机器学习-决策树和随机森林
随机森林 用法: 1. 样本的相似度,认为在一个叶子节点的两个样本是相似的,来计算样本相似度矩阵。 2. 特征选择:修改节点的特征选择,看预测的结果有没有显著变化,有的话,说明被替换的特征比较重要,反之,不重要。 3. Isolation Forest: 随机选择特征,随机选择分割点生成一定深度的决 ...
分类:其他好文   时间:2017-10-17 10:03:43    阅读次数:139
854条   上一页 1 ... 32 33 34 35 36 ... 86 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!