V4多模态版本即将上线
在当前的AI大模型领域,最能体现其迅速发展的关键词之一,是“速度”的提升。距离V4的正式发布仅剩不足五天,官方不仅带来 三轮降价 的策略,随后的新布局也逐步露出端倪——即将推出的满血多模态版本,被视为该系列中的关键拼图,正式进入倒计时。
官方提前剧透,原生视觉能力即将解锁
最近,多模态研发团队的核心研究员在社交平台上发布文章,明确预告了新版V4的到来。在当前的技术背景下,这一新版的推出几乎没有悬念,激发了广泛的期待。

事实表明,自V4发布以来,业界最大的话题与遗憾在于仅推出了Flash(快速版)和Pro(专家版)这两款纯文本大模型。在当前的大模型竞争中,文本能力固然是基础,但原生多模态能力已成为进入顶级行列的通行证。缺乏对图像、视频等视觉信息的原生理解,意味着在复杂真实场景中,模型的表现会受限。而多模态版本的推出,正是弥补这一短板的关键所在。
APP端早期信号:不拼榜分,只拼性价比
敏锐的用户已经注意到,最近客户端的迭代中,模型选择栏悄然新增了“快速”、“专家”以及“视觉”三个独立选项。前两者对应V4的Flash和Pro,而一直待命的“视觉”选项,无疑是为即将上线的新版多模态V4预留的接口。
至于这款满血多模态V4的硬核性能水平,目前尚无权威答案。但结合V4 Pro在纯文本领域的优秀表现,业界普遍预测其视觉处理能力至少可稳居行业前列。
不过,对于一向不走寻常路的产品策略来说,盲目追逐榜单第一并非唯一目标。真正的杀手锏在于“把多模态大模型的价格拉低,让更多开发者与普通用户买得起”。如果能将多模态API的调用成本降至更低的水平,那么将引发的行业格局变化,或许比三轮降价更为显著。