Skip to main content

HNSW 索引

Written: 2026.06

1. 为什么需要这讲

本项目的 Milvus 使用 HNSW(Hierarchical Navigable Small World)索引来加速向量检索。主讲义第2讲提到”本项目使用默认的 HNSW 索引”,但没有解释 HNSW 是什么、为什么快、有什么代价。这讲补充这些内容。

2. 问题:暴力搜索为什么慢

假设你有一批高维向量,用户输入一个查询向量,要找最相似的 Top-K。
暴力搜索(Flat):
  计算查询向量与所有候选向量的距离 → 排序 → 取 Top-K
  时间复杂度:O(N × D),N=向量数量,D=向量维度
  耗时随 N 和 D 线性增长,具体数值取决于硬件、过滤条件和实现
这对于生产环境太慢了。需要**近似最近邻(ANN)**算法来加速。

3. ANN 的核心思想:搜索前先建索引

暴力搜索 = 不建索引,每次全量扫描
ANN 搜索 = 提前建好索引,搜索时走捷径

类比:
  暴力搜索 = 在图书馆一本一本翻找
  ANN 搜索 = 先查目录卡片(索引),按卡片指引去对应的书架
ANN 的核心权衡:精度 vs 速度
  • 精度 100% = 暴力搜索
  • ANN = 用近似召回换查询加速
  • 索引越激进,越可能更快,但越需要用评测集确认召回损失

4. HNSW 的三个核心概念

HNSW = Hierarchical(分层)+ Navigable(可导航)+ Small World(小世界图)

4.1 Small World Graph(小世界图)

小世界图是一种特殊的图结构,具有”六度分隔”特性:图中任意两个节点之间的路径都很短。
在一个好的小世界图中:
  任意两个节点 → 只需跳 3-6 步就能到达

  节点A → 节点C → 节点F → 节点Z
    ↑       ↑       ↑
  (每一步都更接近目标)
对于向量检索,图中每个节点是一个向量,边连接”最近的邻居”。搜索时从入口节点出发,沿边向目标方向移动。

4.2 Navigable(可导航)

“可导航”意味着搜索算法可以贪心地沿着图移动:
搜索步骤:
  1. 从入口节点开始
  2. 检查当前节点的所有邻居
  3. 如果某个邻居比当前节点更接近查询向量,就跳到那个邻居
  4. 重复 2-3,直到没有更近的邻居
  5. 当前节点就是搜索结果

4.3 Hierarchical(分层)

HNSW 的最大创新。单层图的搜索复杂度是 O(log N),但当图很大时,搜索路径仍然较长。HNSW 通过分层来解决:
Layer 2:  ○────○        ← 稀疏层:节点少,边长(跨大步)
          │    │
Layer 1:  ○──○──○──○     ← 中间层:节点适中
          │  │  │  │
Layer 0:  ○─○─○─○─○─○   ← 密集层:包含所有节点,边短(精确)
搜索过程:
1. 从最高层(最稀疏)的入口点开始
2. 在当前层贪心搜索,找到最近节点
3. 下降到下一层,从步骤2的结果继续搜索
4. 重复直到第0层(最密集)
5. 在第0层找到最终结果
这就像从”全国地图”逐步缩放到”街道地图”:
  • 高层:快速定位到目标城市(大步长,少节点)
  • 低层:精确导航到目标地址(小步长,多节点)

5. HNSW 的三个关键参数

参数含义效果
M每个节点最多有多少邻居M↑ → 精度↑、索引大小↑、构建时间↑
efConstruction构建索引时的搜索深度↑ → 索引质量↑、构建时间↑
ef查询时的搜索深度↑ → 召回率↑、查询速度↓
本项目通过 langchain-milvus 创建 collection,默认使用 HNSW 相关参数。不同 Milvus / langchain-milvus 版本的默认值可能变化,因此讲义中不要把 M=16efConstruction=200ef=64 当成不可变标准;如果要确认当前环境的真实参数,应查看 collection 的 index 描述或实际创建日志。

6. HNSW vs 其他索引

索引类型原理优点缺点
FLAT暴力搜索100% 精度O(N×D) 时间
IVF_FLATK-means 聚类 + 只搜最近聚类速度快聚类边界可能漏掉
HNSW分层可导航小世界图速度快 + 精度高内存占用较大
DiskANN基于磁盘的图索引内存占用小需要 SSD
本项目选择 HNSW 的原因:当前知识库规模相对可控,同时更看重低延迟和高召回。Milvus 官方对 HNSW 的定位是低延迟、较高搜索准确性,但内存开销更高。讲义中的规模分档只能作为选型起点,不能作为官方阈值;真实项目要用评测集和压测结果确认召回率、P95 延迟和内存占用。

7. 在本项目中的体现

本项目的 MilvusHybridStore 通过 LangChain 封装创建 Milvus collection,索引参数走当前依赖版本的默认行为。对于当前项目规模,先使用默认参数可以降低复杂度;当数据量、QPS、过滤条件或召回目标变化时,再通过 index 描述、压测和召回评测决定是否调参。

8. 小结

  • HNSW = 分层 + 贪心导航 + 小世界图,快速找到近似最近邻
  • 分层是核心创新:高层大步长定位,低层小步长精确
  • M/ef/efConstruction 控制精度和速度的权衡
  • 本项目先使用默认参数;是否“最优”必须由压测和召回评测证明