BQ(Binary Quantization,二进制量化)向量压缩

将高维实值向量量化为二进制向量({-1,1}或{0,1}),以极小精度损失换取极高压缩率(通常压缩比为32:1或64:1)

1

原始高维向量

生成随机高维实值向量(模拟特征向量)

2

量化阈值确定

计算二值化阈值(通常为0或均值)

3

二进制量化

将每个维度值转换为二进制表示

4

压缩结果与精度

展示压缩结果及量化误差分析

参数设置

高维向量的维度(通常为16-1024)

压缩信息

原始向量大小: 16个浮点数
压缩后大小: 16位二进制
压缩率: 32:1
量化误差: -
压缩效率

BQ核心原理

  • 将实值向量每个维度量化为二进制值({-1,1}或{0,1})
  • 量化规则:若维度值 > 阈值 → 1;否则 → 0(或-1)
  • 极高压缩率:每个维度从32/64位浮点数变为1位二进制
  • 适用场景:近似最近邻搜索、大规模向量检索、内存受限系统
  • 优势:计算速度快,存储成本低,距离计算可通过位运算加速

1 原始高维向量(实值)

随机生成的D维实值向量(数值范围[-5, 5],模拟特征向量):

向量维度值分布可视化