基本概念: 根据样本个体之间的相似度 支持度support 置信度confident 示例:如果一个人买了商品X,那么他很有可能购买商品Y (本例有两个特征值0和1,表示是否购买) 过程思路: 1、在numpy中加载数据集 numpy是二维数组,看上去像一张表。 数组的每一项为个体的某项特征值。 数 ...
分类:
其他好文 时间:
2019-10-08 22:08:01
阅读次数:
183
1.余弦距离 适用场景:余弦相似度衡量的是维度间取值方向的一致性,注重维度之间的差异,不注重数值上的差异。 举例:如某T恤从100块降到了50块(A(100,50)),某西装从1000块降到了500块(B(1000,500)),那么T恤和西装都是降价了50%,两者的价格变动趋势一致,可以用余弦相似度 ...
分类:
其他好文 时间:
2019-09-30 16:21:16
阅读次数:
86
论文标题:Siamese Neural Networks for One-shot Image Recognition 论文作者: Gregory Koch Richard Zemel Ruslan Salakhutdinov 论文地址:https://www.cs.cmu.edu/~rsalakh ...
分类:
Web程序 时间:
2019-09-28 20:35:07
阅读次数:
169
图像平滑 Smoothing, also called blurring, is a simple and frequently used image processing operation. 平滑,也叫模糊. 本质就是把某点的像素值转换为其及其周围像素值的不同权重的叠加.h(k,l)即为卷积核, ...
分类:
其他好文 时间:
2019-09-28 00:33:28
阅读次数:
132
协同过滤 collaborative filtering 人以类聚,物以群分 相似度 1. Jaccard 相似度 定义为两个集合的交并比: Jaccard 距离,定义为 1 - J(A, B),衡量两个集合的区分度: 为什么 Jaccard 不适合协同过滤?—— 只考虑用户有没有看过,没考虑评分大 ...
分类:
其他好文 时间:
2019-09-22 14:33:52
阅读次数:
93
Elasticsearch 的相似度算法 被定义为检索词频率/反向文档频率, TF/IDF ,包括以下内容: 检索词频率 检索词在该字段出现的频率?出现频率越高,相关性也越高。 字段中出现过 5 次要比只出现过 1 次的相关性高。反向文档频率 每个检索词在索引中出现的频率?频率越高,相关性越低。检索 ...
分类:
其他好文 时间:
2019-09-21 10:56:34
阅读次数:
99
最近在编码过程中,遇到过这样一个问题,代码如下,我们有一个父级,他有一定的宽度,在他的里面有两个子级,其中一个是绝对定位的,且要求他们的宽度都和父级保持一致,然后问题就出现了,我们会发现,有了定位的son他的宽度远远的超出了我们父级的宽度,那么问题是怎么引起的呢? 经过各种百度之后发现,原来给子元素 ...
分类:
其他好文 时间:
2019-09-19 16:08:26
阅读次数:
232
关于集合相似性测度的方法做了一些整理: 关于其python语言的算法实现可以参考以下两个链接,就不再赘述: https://mieruca-ai.com/ai/jaccard_dice_simpson/ https://www.jianshu.com/p/a0dfcdf07f18 当然,代码可能只有 ...
分类:
其他好文 时间:
2019-09-19 01:36:09
阅读次数:
197
1、文本相似度,文本匹配模型归纳总结 https://blog.csdn.net/u012526436/article/details/90179466 2、短文本匹配的利器-ESIM https://zhuanlan.zhihu.com/p/47580077 ...
分类:
编程语言 时间:
2019-09-18 10:54:01
阅读次数:
109
活体检测有多种情形,本文所指:从摄像头获取的影像中判断是活体,还是使用了相片等静态图片。 场景描述 用户个人信息中上传了近照,当用户经过摄像头时进行身份识别。 此时,如果单纯的使用摄像头获取的影像进行人脸相似度比对,则举一张合适的相片对准摄像头也是可以通过的。于是检测摄像头前影像是否为活体的需求就产 ...