PQ(乘积量化)压缩过程演示

PQ是一种高效的高维向量压缩技术,通过将高维向量分块并对每个子向量独立量化,实现数据的高效压缩

参数设置

高维向量的维度
将向量分为M个子向量
自动计算: d = D/M
每个子码本包含的聚类中心数

压缩信息

原始大小: 16个数值
压缩后大小: 4个索引
压缩率: 4:1
压缩效率

压缩步骤

1 生成随机高维向量

创建需要压缩的原始高维数据点

2 向量分块

将原始向量分为M个子向量

3 子码本生成

为每个子空间生成聚类中心

4 子向量量化

匹配每个子向量到最近的中心

5 压缩结果

组合索引形成最终压缩表示

1 原始高维向量

随机生成的D维向量(每个元素代表一个维度的值):