最邻近搜索

✍ dations ◷ 2025-12-08 19:33:23 #人工智能,算法

最邻近搜索（Nearest Neighbor Search, NNS）又称为“最近点搜索”（Closest point search），是一个在尺度空间中寻找最近点的优化问题。问题描述如下：在尺度空间中给定一个点集和一个目标点 ∈ ，在中找到距离最近的点。很多情况下，为多维的欧几里得空间，距离由欧几里得距离或曼哈顿距离决定。

高德纳在《计算机程序设计艺术》（1973）一书的第三章中称之为邮局问题，即居民寻找离自己家最近的邮局。

最邻近搜索问题在很多领域中都有应用，包括：

最邻近搜索问题有若干种解决方案，这些算法的优劣决定于他们求解的时间复杂度和用来查找的数据结构的空间复杂度。一种通常的说法表述为“维数灾难”（curse of dimensionality），指对于在大维数的欧几里得空间里用最邻近搜索的话，无法找到多项式的算法和多对数的查找时间。

最简单的最邻近搜索便是遍历整个点集，计算它们和目标点之间的距离，同时记录目前的最近点。这样的算法较为初级，可以为较小规模的点集所用，但是对于点集的尺寸和空间的维数稍大的情况不适用。线性查找所需时间为O（），其中N是的势，是的维。由于不需要建立数据结构，所以线性查找没有存储空间复杂度的问题。

从七十年代起分支限界方法被应用于这个问题。对欧几里得空间来说，这个方法被称为空间索引或者空间访问方法。目前已发展出好几种分支限界方法。恐怕最简单的当属K-d树，它将查找空间不断将父节点包含的区域分为相邻的两部分，每部分包含原来区域中的一半点。求解时，从根节点开始在每个分叉点上对目标点进行计算，直到叶节点。对于给定的维度，查找时间复杂度为O（log ）。R树数据结构能高效插入和删除节点，用来解决动态环境下的最邻近搜索。

对于一般的度量空间，分支限界方法被称为度量树，特别的例子有VP树和Bk树。

LSH（Locality sensitive hashing）通过对点进行某种度量操作后将点分组散列在不同的次点集中。在这种度量下相互间距离较近的点被分在同一个次点集的可能性较高。

覆盖树有一个基于点集倍常量的理论界限。这个查找时间的界限是O（c12 log n），其中是点集的膨胀常数。

在最邻近搜索的几个变化中，最著名的是KNN（K-nearest neighbor algorithm）和ε近似最邻近查找（ε-approximate nearest neighbor search）。

KNN查找最邻近的K个点。这种方法常被用在预测分析中，用某点的一些临近点来对它估计和分类。

在一些应用中指需要有个对最邻近的猜测。这种情况下，我们可以用一个不保证能每次都返回绝对正确的最近点的算法，用来提高运算速度或节约存储空间。常常这样的算法大都能找到正确的最近点，但这大大取决于采用点集的分布。

采用近似查找的算法包括Best Bin First和Balanced Box-Decomposition Tree。

ε近似最邻近查找是目前流行的打破维数灾难的工具。

最邻近距离比不直接用目标点和邻近点的距离作为阈值，而是将与到前一个邻近点的距离相关的比值来作为阈值。这被用在基于内容的图像检索中，通过基于本地特征的相似性的“例子查找”来得到图像。更广泛的用途是在一些匹配问题中。

有时，我们需要找到在整个点集中距离所有点都最近的那个点。把最邻近搜索在所有点上运行一次自然能解决问题，但改进的策略能避免点集中距离信息的冗余，从而更高效地查找。比如：当我们算出了X到Y的距离，我们也同时得到了Y到X的距离，于是结果就能被以后的一次求解直接利用。

相关

油墨墨水是一种含有色素或染料的液体，通常是由颜料、连结料、溶剂、助剂等组成的混合物，外观为具有一定的流动性的胶浆状物质。墨水被用于书写或绘画。最早的墨水有使用金属、胡桃
欧尚欧尚（法语：Auchan）是法国量贩店集团公司，总部在克鲁瓦。2016年，欧尚共有774个大型超市、817个超级市场和337900个员工，遍布15个国家和地区。 2019年,欧尚零售在欧洲，亚洲和非洲的17
奇布恰语系奇布恰语系（Chibchan languages）又译奇布查语系，是分布在洪都拉斯到哥伦比亚北部，包括尼加拉瓜、哥斯达黎加、巴拿马的原住民语系。该语系来源于穆伊斯卡人使用的已灭绝语言奇布
杭嘉湖道杭嘉湖道是清朝时期设置的一个道。雍正四年（1726年）置，治所在嘉兴县（今浙江省嘉兴市），辖嘉兴、杭州、湖州三府。乾隆十九年（1754年），移驻杭州府（今杭州市）。民国初废。 *霸昌道 · 通永
内木志内木志（日语：ないきこころ，1997年4月6日－）是日本女艺人，为女子偶像团体NMB48前成员，2013年以选秀生1期身份出道。滋贺县出身。 2013年2014年2016年2018年2019年2019年石田优美（副队
初恋志已停播已停播已停播
古斯塔夫·德·莫利纳里古斯塔夫·德·莫利纳里（Gustave de Molinari，1819年3月3日－1912年1月28日）是比利时裔的法国经济学家，属于自由主义的自由放任学派。在莫利纳里一生中，他和其他自由主义的经济学家
蓝龙 (动画) 根华出版社《蓝龙》（日语：BLUE DRAGON）为Mist Walker以游戏软件《蓝龙》为原作改编而成的动画。2007年4月到2009年3月播放。以描述主角修为首的少年少女们能够操控自己的“影
国际记者协会国际记者协会（IPA）是一个由专业娱乐记者组成的组织，代表国内外的报刊、电视、广播、有线频道以及新媒体通路市场。该协会自1997年1月起，设立了一个年度电影电视奖项卫星奖。所
彰化温泉彰化温泉位于台湾彰化县彰化市八卦山麓，在日治时代名闻一时，唯现已不存，原址现为大佛风景区后方停车场。彰化温泉系加热八卦山涌出之矿泉，属于碳酸铁泉，对胃肠病及妇人病有效。彰