12月的最后几天,研究了下k匿名算法,在这里总结下。 提出背景 Internet 技术、大容量存储技术的迅猛发 展以及数据共享范围的逐步扩大,数据的自动采集 和发布越来越频繁,信息共享较以前来得更为容易 和方便;但另一方面,以信息共享与数据挖掘为目的的数据发布过程中隐私泄露问题也日益突出,因此如何在 ...
分类:
编程语言 时间:
2018-12-28 15:28:54
阅读次数:
1147
编辑距离问题 什么是两个字符串的编辑距离(edit distance)?给定字符串s1和s2,以及在s1上的如下操作: 插入(Insert)一个字符 移除(Remove)一个字符 替换(Replace)一个字符 试问最小需要多少次这样的操作才能使得s1转换为s2? &emsp ...
分类:
其他好文 时间:
2018-12-27 12:01:35
阅读次数:
176
Levenshtein Distance 算法,又叫 Edit Distance 算法,是指两个字符串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个串的相似度越大。 算法实现原理图解: a.首先是有 ...
分类:
编程语言 时间:
2018-12-27 12:01:26
阅读次数:
327
在PC硬件体系结构里,速度最快的存储器是CPU里面的寄存器,接着到二级缓存,再到系统RAM内存,最后才到硬盘。由于这样的体系结构,就决定了操作系统对文件的操作方式,或者说是最优化的算法。比如操作系统接收到写文件的数据时,就会先把数据保存到RAM里,然后在合适的时间或者合适的数据量时再写到硬盘里。但有 ...
FuzzyWuzzy 模糊字符串匹配,它使用Levenshtein Distance来计算简单易用的包中序列之间的差异。 前置条件 Python 2.7 or higher difflib python-Levenshtein(可选的,在字符串匹配中提供4-10倍的加速,不过在某些情况下可能导致不同 ...
分类:
其他好文 时间:
2018-12-25 18:08:56
阅读次数:
555
题目13 1?使用函数计算两点间的距离?(10 分) 本题要求实现一个函数,对给定平面任意两点坐标(x?1??,y?1??)和(x?2??,y?2??),求这两点之间的距离。 ~~~ include include double dist( double x1, double y1, double ...
分类:
其他好文 时间:
2018-12-22 13:06:05
阅读次数:
293
latitude—自己所在纬度, longitude—自己所在经度 m.latitude—另一对象所在纬度, m.longitude—另一对象所在经度 distance = round(6367000 * 2 * asin(sqrt(pow(sin(((m.latitude * pi()) / 18 ...
分类:
编程语言 时间:
2018-12-22 01:12:33
阅读次数:
253
题目链接 题意 : 给出一个联通图和一些特殊的点,现在定义cost(u,v)为一条从u到v的路径上面边权的最大值 , 定义dis(u,v) 为从u到v 路径上面cost 的最小值 然后求所有特殊点到其他特殊点的最大距离 题解: 做这题前,首先思考一件事情,对于一颗树来说点到点的距离是不是就是树上面路 ...
分类:
其他好文 时间:
2018-12-18 14:37:52
阅读次数:
275
# Write your MySQL query statement belowSELECT ROUND(MIN(SQRT(POW(p1.x-p2.x,2)+POW(p1.y-p2.y,2))),2) AS shortestFROM point_2d p1LEFT JOIN point_2d p2O ...
分类:
其他好文 时间:
2018-12-18 10:56:41
阅读次数:
315