阶段 1: 向量投影 ($L \times K = 12$ 次)
阶段 2: 哈希码生成与索引存储 ($L=3$ 次)
演示说明:
- 本演示使用 **Euclidean LSH (随机投射)** 策略。
- **$K=4$** (每带 4 个位) 决定了哈希码的长度和精确率。
- **$L=3$** (3 个哈希带) 决定了哈希表的数量和召回率。
阶段 1: 向量投影 ($L \times K = 12$ 次)
检索说明:
- 查询向量 $\mathbf{Q}$ (Query) 与已索引向量 $\mathbf{V}$ (Index) 使用**相同的** LSH 族。
- 因为 $\mathbf{Q}$ 与 $\mathbf{V}$ 相似,它们在多个哈希带中碰撞(生成相同的哈希码)。
- 所有碰撞的向量 $\mathbf{V}$ 组成了 **候选邻居集**。