福强的本周AI热点回顾与简评

王福强

2025-08-13


关注「福强私学」,紧跟AI前沿。

AI 理论

看到一个”最近寻径”的算法突破,没细看。

AI 模型

GLM-4.5V

上一个牛逼的国产视觉模型是Qwen 2.5VL

GLM-4.5V模型也是视觉模型

反馈不错。

Claude Sonnet 4 开始支持1M tokens 上下文

最早100万tokens上下文的是 Google Gemini,现在, Claude Sonnet 4也支持了。

Jan-v1

开源的4B模型,使用场景主要面向web搜索与深度研究(Deep research)

据说SimpleQA的准确度达到91% (对标Perplexity Pro)

该模型基于Qwen3-4B-Thinking,针对推理与工具使用进行了微调。

Gemma3 270M

Google 新推出 Gemma3 270M,大模型里的小模型, 主要面向轻量级设备, 500兆内存就能跑, 如果你有装Ollama,直接 ollama run gemma3:270m 就可以了。

与之对应的是千问的0.6B模型:

AI 产品

v0.dev这周免费

搞活动呗,不过,当你看到这篇文字的时候,像试试也没戏了😂

LEANN

UC伯克利, CUHK, AWS 和 UC Davis 的研究者新推出的轻量级向量数据库,

号称是最小的向量数据库,面向个人设备。

LEANN这个名字应该是LE+ANN这么拆,我一开始以为是LEAN + N这么拆🤣

我还没细看

这周更多在准备培训的demo和ppt了

但感觉福强正在开发的 KVectors 向量数据库也可以在它这个领域发挥同样的作用,LEANN是python, KVectors是java,首先性能层面KVectors应该更有优势,另外就是结合 DiskANN 和 HNSW 这两个ANN索引算法, KVectors 应该也可以在ANN索引层面不输这个新产品吧? 不过,KVectors本月刚开始开发,刚完成不需要索引的VectorCollection多种类型的实现,AnnVectorCollection是下个阶段的实现重点。

Open Lovable

又一个对标已有商业产品的开源产品,可以直接复制已有网站。

不过搭建和依赖对普通用户来说可能费点儿劲, 而且,瞅了眼,都是依赖海外的大模型。

https://github.com/mendableai/open-lovable

AI Infra(AI基础设施)

Spring AI 发布 1.0.1

详情参考: https://spring.io/blog/2025/08/08/spring-ai-1

Oracle 🤝 Gemini

Oracle云上可以访问Gemini服务了。

AI 相关推荐阅读

暂无,本周准备培训的交付物料,没空儿…


>>>>>> 更多阅读 <<<<<<


「福强私学」来一个?

「福强私学」, 一部沉淀了个人成长、技术与架构、组织与管理以及商业上的方法与心法的百科全书。

footer img for kb.afoo.me

开天窗,拉认知,订阅「福报」,即刻拥有自己的全模态人工智能。

订阅「福报」