OpenCV 学习笔记(模板匹配) 模板匹配是在一幅图像中寻找一个特定目标的方法之一。这种方法的原理非常简单,遍历图像中的每一个可能的位置,比较各处与模板是否“相似”,当相似度足够高时,就认为找到了我们的目标。 在 OpenCV 中,提供了相应的函数完成这个操作。 matchTemplate 函数: ...
分类:
其他好文 时间:
2017-08-12 17:12:47
阅读次数:
259
最近把JAVA 语言规范 稍微的浏览下,本着毫不负责任的态度,对一些模式进行推测性猜测。后期可能会对猜测做验证。 JAVA 和C#的语言和设计思想高度相似度。 1.JAVA 字节码与IL语言 2.JVM 与CLR AOP与DI 一、.net的AOP与DI的主流方式 是动态注入即使 诸如 反射发出 E ...
分类:
编程语言 时间:
2017-08-10 23:41:27
阅读次数:
188
实现代码如上,因为Statistics.corr(RDD[Double],RDD[Double]),所以SparkSQL读取后的数据生成的dataFrame必须转换,第一步是转换成RDD[Row],Row就相当于sql查询出来的一条数据,这里也转换过多次才成功,最后百度得到可以先.cast(Doub ...
分类:
其他好文 时间:
2017-08-07 11:54:15
阅读次数:
650
ElasticSearch 的检索没有Solr那么多类别,ElasicSearch默认是模糊查询,通过使用余弦相似度量算法来判断keyword和检索值的相似度,然后取出相似度最高的数据作为返回。 ...
分类:
其他好文 时间:
2017-08-05 11:49:50
阅读次数:
230
近邻算法是机器学习算法中的入门算法,该算法用于针对已有数据集对未知数据进行分类。 该算法核心思想是通过计算预測数据与已有数据的相似度猜測结果。 举例: 如果有例如以下一组数据(在下面我们统一把该数据作为训练数据): 身高 年龄 国籍 170 23 中国 180 21 美国 185 22 俄国 175 ...
分类:
编程语言 时间:
2017-08-05 09:58:07
阅读次数:
127
Spectral Clustering 算法的全貌: 1)根据数据构造一个 Graph ,Graph 的每一个节点对应一个数据点,将相似的点连接起来,并且边的权重用于表示数据之间的相似度。把这个 Graph 用邻接矩阵的形式表示出来,记为 W 。 2)把每一列元素加起来得到N 个数,把它们放在对角线 ...
分类:
其他好文 时间:
2017-08-04 20:37:23
阅读次数:
124
假设有N个待聚类的样本,对于层次聚类来说,步骤: 1、(初始化)把每个样本归为一类,计算每两个类之间的距离,也就是样本与样本之间的相似度; 2、寻找各个类之间最近的两个类,把他们归为一类(这样类的总数就少了一个); 3、重新计算新生成的这个类与各个旧类之间的相似度; 4、重复2和3直到所有样本点都归 ...
分类:
其他好文 时间:
2017-08-03 01:04:39
阅读次数:
146
恢复内容开始 第二章 提供推荐CF 协同型过滤:允许人们根据自己对文档的感兴趣程度添加标注,并利用这一信息为他人进行文档过滤。 搜集偏好:在python中创建一个嵌套的字典 寻找相近的用户:计算不同用户间的相似度评价值 方法1:欧几里得距离评价 以经过人们一致评价的物品作为坐标轴,然后将参与评价的人 ...
分类:
其他好文 时间:
2017-07-31 20:05:24
阅读次数:
177
def loadExData(): return[[1,1,1,0,0], [2,2,2,0,0], [1,1,1,0,0], [5,5,5,0,0], [1,1,0,2,2], [0,0,0,3,3], [0,0,0,1,1]] def ... ...
分类:
编程语言 时间:
2017-07-30 11:25:56
阅读次数:
334
What 用二进制表示机器状态。 使用N位状态寄存器来对N个状态进行编码 参考链接 例如: 自然状态码为:000,001,010,011,100,101 独热编码为:000001,000010,000100,001000,010000,100000 Why 在机器学习中,经常有一些值为离散的属性,比 ...
分类:
其他好文 时间:
2017-07-29 18:17:23
阅读次数:
381