KVectors向量数据库准备开源啦~

王福强

2025-11-16


前阵子老王说

KVectors可以搞开源+商业服务的模式

虽然这个产品从一开始构思、设计到实现就没考虑过开源

但“听人劝吃饱饭”嘛

这几天简单思考了下

决定这样…

开源版 KVectors 向量数据库(kvectors-oss)

开源版KVectors向量数据库是最初版设计和实现,当时的设计前提是:

  1. 模型更新迭代太快,向量数据库中的向量可能因模型变更原因需要全量重新处理和存储;
  2. 数据衍生系统,所以,数据变更可以通过从原始数据源重新加载;
  3. 阶段性重新构建索引以提高性能与数据的新鲜度;

在这些前提下, 最初版的KVectors向量数据库的存储是APPEND_ONLY的,也就是只追加,不提供更新与删除等操作。(这也是前阵子金总说要基于这版打造商业方案,我心里没底儿的原因,因为还没经过实际场景检验。)

当然,除了APPEND_ONLY向量存储,还支持TRANSIENT类型的向量存储,这更多是便于测试或者用完即弃的场景。

向量索引方面,最初版支持如下索引类型:

  1. FLAT索引
  2. HNSW索引

看起来很少,对吧?

但其实这两个索引 + APPEND_ONLY 向量存储 已经可以满足大部分场景的需求,要知道头部向量数据库产品weaviate,其实也就是支持这两种索引,虽然它声称可以支持三种,但其实就是FLAT和HNSW再根据数据的生命周期再组合一下。

如果配合应用架构设计,这一版的KVectors向量数据库基本可以满足8成以上 AI 场景需求。

企业版 KVectors 向量数据库(kvectors-enterprise)

企业版 KVectors 向量数据库会在开源版基础上在如下方面进行增强:

  1. 更多的向量索引类型。除了支持开源版支持所有向量索引类型,企业版KVectors向量数据库还支持如下向量索引(Scala 版 IVF 索引和 IVF_RABITQ 索引,完全自主设计与实现!):
    • IVF(IVF_FLAT)
    • IVF_RABITQ
    • LSH
    • 更多…
  2. 更强劲的向量存储引擎
    • 支持全面CRUD操作的向量存储引擎与向量集合, 既允许用户极速向KVectors向量数据库注入高维向量,又支持根据业务场景对向量的数据与元信息进行更改。
  3. 更全面的商业服务与支持
    • 除了提供开箱即用的极速向量数据库产品,还为用户提供AI智能体与技术体系内的架构咨询与商业支持。
    • 总之,力求客户的钱花得值!

后续工作


>>>>>> 更多阅读 <<<<<<


「福强私学」来一个?

「福强私学」, 一部沉淀了个人成长、技术与架构、组织与管理以及商业上的方法与心法的百科全书。

footer img for kb.afoo.me

开天窗,拉认知,订阅「福报」,即刻拥有自己的全模态人工智能。

订阅「福报」