摘要: 为了提高源程序代码之间相似性的检测效率,提出一种基于序列聚类的相似代码检测算法. 算法首先把源代码按照其自身的结构进行分段提取,然后对各个分段进行部分代码变换,再以带权重的编辑距离为相似度量标准对这些符号进行序列聚类,得到相似的程序代码片段,以达到对源程序进行相似功能检测的目的. 应用: 可...
分类:
编程语言 时间:
2014-10-12 18:45:08
阅读次数:
349
/* *========================================================== * Filename : cw.cpp * Description : * * Author : RollStone (rs), jeal...
分类:
其他好文 时间:
2014-10-11 23:20:46
阅读次数:
294
代码: https://gist.github.com/orangle/d83bec8984d0b4293710
参考:...
分类:
编程语言 时间:
2014-10-11 19:16:06
阅读次数:
187
黑链,是指看不见,但是却被搜索引擎计算权重的外链。最常见的黑链就是通过各种网站程序漏洞,获取搜索引擎权重或者PR较高的网站的webshell,进而在被黑网站上链接自己的网站,其性质与明链一致,都是属...
分类:
Web程序 时间:
2014-10-10 18:19:04
阅读次数:
306
本章介绍着色器的基本知识以及Geiv下对其提供的支持接口,并以“渐变高斯模糊”为线索进行实例的演示讲解。
[背景信息]
[计算机中央处理器的局限性]
在大学的“数字图像处理”课程中,老师讲解了高斯模糊的基本算法,并使用C#进行了基本实现。
高斯模糊,简单地说,就是使用高斯权重模板对图像的每一个像素进行再计算、填充,以达到模糊的效果。
在课程中,对于给定的模板与模糊度系数,对一副800X6...
分类:
其他好文 时间:
2014-10-09 15:13:38
阅读次数:
364
使用用户打标签次数*物品打标签次数做乘积的算法虽然简单,但是会造成热门物品推荐的情况。物品标签的权重是物品打过该标签的次数,用户标签的权重是用户使用过该标签的次数,从而导致个性化的推荐降低,而造成热门推荐。
运用TF-IDF的思想可以对算法进行改进。TF-IDF(term frequemcy-inverse documnet frequency)是一种用于资讯检索和文本挖掘的加权技术。用来评估一...
分类:
其他好文 时间:
2014-10-09 01:49:57
阅读次数:
250
??
对从网络上抓取到的网页进行处理:建立网络库,分词,去重,if-tdf计算权重,归一化,然后根据查询词将文本相似度从高到低的依次返回给客户
第一阶段:python网络爬虫抓取网页,并存盘
第二阶段:对磁盘上的网页文件建立网页库,将全部网页写入网页库,并建立相应网页的偏移量索引文件(1 23 100)-->(dofid, offset, size),以便读取网页内容
...
分类:
其他好文 时间:
2014-10-04 16:33:27
阅读次数:
269
1、轮询(默认)每个请求按时间顺序逐一分配到不同的后端服务器,后端服务器down掉,能自动剔除2、weight指定轮询几率,weight和访问比率成正比,用于后端服务器性能不均的情况。upstream backend { server 192.168.0.14 weight=10; se...
分类:
其他好文 时间:
2014-10-01 22:19:31
阅读次数:
172
布局关键词按照首页、栏目页、内页优先等级依次布局。栏目页关键词是首页关键词的扩展,内页长尾词是栏目关键词的扩展。以羊羊吧(yangyangbbs.com为例):1、首页关键词首页关键词是整个网站内容的概括,网站的首页权重高于栏目页和内页,所以首页的关键词是竞争度比较大的短词。例如羊羊吧首页的关键词是...
分类:
Web程序 时间:
2014-09-29 14:33:31
阅读次数:
181
外链在网站排名的前中期起到非常重要的角色,在网站还处于前中期时外链能传递给网站权重。而网站只有在具有一定权重以后才能被收录首页和内页,并且传递的权重能有助于排名的提升。外链还具有推广作用,能引导用户进入网站,所以网站前期一定要做外链。学习要点1:寻找外链平台寻找外链平台需要注意有:平台的权重、收录、...
分类:
Web程序 时间:
2014-09-29 14:01:51
阅读次数:
205