码迷,mamicode.com
首页 > 其他好文 > 详细

近似k近邻检索Ak-NN,其中包含k-NN(一)

时间:2021-01-02 11:38:02      阅读:0      评论:0      收藏:0      [点我收藏+]

标签:效率   时间   根据   mic   相关   最可   编码   距离   邻居   

k近邻(k-Nearest Neighbor,简称kNN)学习是一种常用的监督学习方法,其工作机制非常简单:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于k个“邻居”的信息来进行预测。
1. 最近邻检索(Nearest Neighbor Search)
最近邻检索就是根据数据的相似性,从数据库中寻找与目标数据最相似的项目。这种相似性通常会被量化到空间上数据之间的距离,可以认为数据在空间中的距离越近,则数据之间的相似性越高。
k最近邻(K-NearestNeighbor,K-NN)检索:当需要查找离目标数据最近的前k个数据项时。
最近邻检索是线性复杂度的,不能满足对于大规模数据检索的时间性能要求。
2.近似检索(Approximate Nearest Neighbor,ANN)
近似最近邻检索利用数据量增大后数据之间会形成簇状聚集分布的特性,通过对数据分析聚类的方法对数据库中的数据进行分类或编码,对于目标数据根据其数据特征预测其所属的数据类别,返回类别中的部分或全部作为检索结果。

近似最近邻检索的核心思想:搜索可能是近邻的数据项而不再只局限于返回最可能的项目,在牺牲可接受范围内的精度的情况下提高检索效率。

3.总结
根据以上内容可得以下图(图中的不通顺地方是因为我不知道该怎么翻译图片)

技术图片

关于PCAF的相关内容及具体实现过程以后会实现。未完待续..

近似k近邻检索Ak-NN,其中包含k-NN(一)

标签:效率   时间   根据   mic   相关   最可   编码   距离   邻居   

原文地址:https://blog.51cto.com/15069472/2577214

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!