互联网资讯

V4多模态版本即将上线

2026年5月5日 ·

在当前的AI大模型领域，最能体现其迅速发展的关键词之一，是“速度”的提升。距离V4的正式发布仅剩不足五天，官方不仅带来三轮降价的策略，随后的新布局也逐步露出端倪——即将推出的满血多模态版本，被视为该系列中的关键拼图，正式进入倒计时。

官方提前剧透，原生视觉能力即将解锁

最近，多模态研发团队的核心研究员在社交平台上发布文章，明确预告了新版V4的到来。在当前的技术背景下，这一新版的推出几乎没有悬念，激发了广泛的期待。

事实表明，自V4发布以来，业界最大的话题与遗憾在于仅推出了Flash（快速版）和Pro（专家版）这两款纯文本大模型。在当前的大模型竞争中，文本能力固然是基础，但原生多模态能力已成为进入顶级行列的通行证。缺乏对图像、视频等视觉信息的原生理解，意味着在复杂真实场景中，模型的表现会受限。而多模态版本的推出，正是弥补这一短板的关键所在。

APP端早期信号：不拼榜分，只拼性价比

敏锐的用户已经注意到，最近客户端的迭代中，模型选择栏悄然新增了“快速”、“专家”以及“视觉”三个独立选项。前两者对应V4的Flash和Pro，而一直待命的“视觉”选项，无疑是为即将上线的新版多模态V4预留的接口。

至于这款满血多模态V4的硬核性能水平，目前尚无权威答案。但结合V4 Pro在纯文本领域的优秀表现，业界普遍预测其视觉处理能力至少可稳居行业前列。

不过，对于一向不走寻常路的产品策略来说，盲目追逐榜单第一并非唯一目标。真正的杀手锏在于“把多模态大模型的价格拉低，让更多开发者与普通用户买得起”。如果能将多模态API的调用成本降至更低的水平，那么将引发的行业格局变化，或许比三轮降价更为显著。