福强的本周AI热点回顾与简评
王福强
关注「福强私学」,紧跟AI前沿。
AI 理论
看到一个”最近寻径”的算法突破,没细看。
AI 模型
GLM-4.5V
上一个牛逼的国产视觉模型是Qwen 2.5VL
GLM-4.5V模型也是视觉模型
反馈不错。
Claude Sonnet 4 开始支持1M tokens 上下文
最早100万tokens上下文的是 Google Gemini,现在, Claude Sonnet 4也支持了。
Jan-v1
开源的4B模型,使用场景主要面向web搜索与深度研究(Deep research)
据说SimpleQA的准确度达到91% (对标Perplexity Pro)
该模型基于Qwen3-4B-Thinking,针对推理与工具使用进行了微调。
Gemma3 270M
Google 新推出 Gemma3 270M,大模型里的小模型, 主要面向轻量级设备, 500兆内存就能跑, 如果你有装Ollama,直接 ollama run gemma3:270m
就可以了。
与之对应的是千问的0.6B模型:
AI 产品
v0.dev这周免费
搞活动呗,不过,当你看到这篇文字的时候,像试试也没戏了😂
LEANN
UC伯克利, CUHK, AWS 和 UC Davis 的研究者新推出的轻量级向量数据库,
号称是最小的向量数据库,面向个人设备。
LEANN这个名字应该是LE+ANN这么拆,我一开始以为是LEAN + N这么拆🤣
我还没细看
这周更多在准备培训的demo和ppt了
但感觉福强正在开发的 KVectors 向量数据库也可以在它这个领域发挥同样的作用,LEANN是python, KVectors是java,首先性能层面KVectors应该更有优势,另外就是结合 DiskANN 和 HNSW 这两个ANN索引算法, KVectors 应该也可以在ANN索引层面不输这个新产品吧? 不过,KVectors本月刚开始开发,刚完成不需要索引的VectorCollection多种类型的实现,AnnVectorCollection是下个阶段的实现重点。
Open Lovable
又一个对标已有商业产品的开源产品,可以直接复制已有网站。
不过搭建和依赖对普通用户来说可能费点儿劲, 而且,瞅了眼,都是依赖海外的大模型。
https://github.com/mendableai/open-lovable
AI Infra(AI基础设施)
Spring AI 发布 1.0.1
详情参考: https://spring.io/blog/2025/08/08/spring-ai-1
Oracle 🤝 Gemini
Oracle云上可以访问Gemini服务了。
AI 相关推荐阅读
暂无,本周准备培训的交付物料,没空儿…
开天窗,拉认知,订阅「福报」,即刻拥有自己的全模态人工智能。
