原始高维向量 (d = 5)
这是一个随机生成的5维向量,代表高维空间中的一个数据点。
随机投影矩阵 (k×d)
这是一个随机生成的2×5矩阵,用于将高维向量投影到低维空间。
投影后的低维向量 (k = 2)
矩阵乘法计算过程
点击"执行投影计算"按钮查看详细计算步骤...
投影公式:y = R·x,其中y是投影后的向量,R是投影矩阵,x是原始向量
随机投影的工作原理
1
高维数据表示
原始数据点表示为d维向量,其中d是数据的原始维度。在许多实际应用中,d可能非常大(如文本分类中的词袋模型可能有数千维)。
2
随机矩阵生成
构造一个k×d的随机矩阵R,其中k是目标维度(k << d)。矩阵元素通常服从均值为0、方差为1/k的正态分布。
3
矩阵乘法投影
通过矩阵乘法y = R·x将d维向量x投影到k维空间,得到低维向量y。对于结果中的每个元素yi,计算方法是矩阵第i行与原始向量的点积:
yi = Ri1·x1 + Ri2·x2 + ... + Rid·xd
4
距离近似保持
根据Johnson-Lindenstrauss引理,随机投影可以在降低维度的同时近似保持数据点之间的距离关系。