在现如今的软件开发过程中,软件开发人员将很多的精力放在重复的编码中。特别是流行的MVC架构模式下,项目各个层次的功能更加独立,这也间接的造成了代码的相似度更高。因此需要寻找一种可以减少软件开发人员重复编码的方式,让软件开发人员可以将更多的精力放在业务逻辑编码以及其他更具有价值的工作上。 今天小编向大 ...
                            
                            
                                分类:
其他好文   时间:
2020-02-15 09:33:02   
                                阅读次数:
118
                             
                    
                        
                            
                            
                                模板匹配是指在图像A中寻找与图像B最相似的部分,一般A称为输入图像,B称为模板图像 模板匹配函数 result = cv2.matchTemplate(image , temp1 , method , [,mask]) result 函数每次计算模板和输入图像的重叠区域相似度之后将结果存入映射图像r ...
                            
                            
                                分类:
其他好文   时间:
2020-02-13 22:32:23   
                                阅读次数:
89
                             
                    
                        
                            
                            
                                原文:https://www.cnblogs.com/dcb3688/p/4610660.html import cv2 import numpy as np #原文:https://www.cnblogs.com/dcb3688/p/4610660.html # 均值哈希算法 def aHash( ...
                            
                            
                                分类:
编程语言   时间:
2020-02-13 13:01:37   
                                阅读次数:
84
                             
                    
                        
                            
                            
                                代码相似度检测相关软件: 1.NiCad Clone Detector NiCad Clone Detector 是一个灵活的基于 TXL 的混合语言敏感/文本比较软件克隆检测系统,由James R. Cordy和Chanchal K. Roy开发,最初是基于Chanchal的博士论文工作。NiCa ...
                            
                            
                                分类:
其他好文   时间:
2020-02-11 09:54:57   
                                阅读次数:
235
                             
                    
                        
                            
                            
                                网络中的机器学习节点分类链接预测机器学习的生命圈需要特征工程网络的特征学习——特征向量 embeddingnetwork embedding的意义节点的表征节点的相似度衡量→网络相似度衡量网络信息编码,生成节点表征用途:异常检测,属性预测,聚类,关系预测例子:deepwalk难度:当前的深度学习视为... ...
                            
                            
                                分类:
其他好文   时间:
2020-02-07 00:58:56   
                                阅读次数:
134
                             
                    
                        
                            
                            
                                最近在复习数据库索引部分,看到了 fulltext,也即全文索引,虽然全文索引在平时的业务中用到的不多,但是感觉它有点儿意思,所以花了点时间研究一下,特此记录。引入概念通过数值比较、范围过滤等就可以完成绝大多数我们需要的查询,但是,如果希望通过关键字的匹配来进行查询过滤,那么就需要基于相似度的查询, ...
                            
                            
                                分类:
数据库   时间:
2020-02-05 12:00:49   
                                阅读次数:
101
                             
                    
                        
                            
                            
                                使用句子中出现单词的Vector加权平均进行文本相似度分析虽然简单,但也有比较明显的缺点:没有考虑词序且词向量区别不明确。如下面两个句子:“北京的首都是中国”与“中国的首都是北京”的相似度为1。“学习容易”和“学习困难”的相似度很容易也非常高。为解决这类问题,需要用其他方法对句子进行表示,LSTM是... ...
                            
                            
                                分类:
其他好文   时间:
2020-02-04 14:11:31   
                                阅读次数:
99
                             
                    
                        
                            
                            
                                今天进行了相似推荐算法的学习。 今天比较了几个协同过滤算法,其中基于用户的算法会存在数据稀疏性:一个大型的电子商务推荐系统一般有非常多的物品,用户可能买的其中不到1%的物品,不同用户之间买的物品重叠性较低,导致算法无法找到一个用户的邻居,即偏好相似的用户和算法扩展性方面的问题,而基于物品的协同过滤算 ...
                            
                            
                                分类:
其他好文   时间:
2020-02-01 19:22:51   
                                阅读次数:
82
                             
                    
                        
                            
                            
                                    Jaccard相关系数用来衡量两个集合的相关性,数值越大,相似度就越高。相对于Jaccard系数,Jaccard距离是用来衡量两个样本集合的差异性的。 Jaccard相关系数: Jaccard距离: 如果A,B集合中元素的取值为二值数(0,或者1,0代表此元素不在这个集合中,1代表此元素在这个集合中 ...
                            
                            
                                分类:
其他好文   时间:
2020-01-30 17:22:37   
                                阅读次数:
215
                             
                    
                        
                            
                            
                                "题目" 正解 一听到正解是NTT,我心态崩了。 我特么知道是NTT都不知道该怎么做!哪里像个卷积了? 好吧,是我孤陋寡闻…… 设两个字符串分别为$A$和$B$ 可以考虑试着计算出$A$每个子串和$B$的相似度(就是位置相同、字母相同的个数),直接统计就完事了。 看到字符集这么小,就可以对于每个字母 ...
                            
                            
                                分类:
其他好文   时间:
2020-01-28 20:56:56   
                                阅读次数:
65