这家科技巨头在人工智能领域曾以先锋姿态出现,但因谨慎错过早期大模型机遇,如今正变得更大胆开放,在产品和生态层面实现追赶与落地。
北京时间 2 月 8 日 21 点,该公司宣布了旗下最强大多模态模型 Gemini 的最新进展(包含最大级别的 Ultra、中间级的 Pro、最小且适配端侧的 Nano),核心在于推动 Gemini 的大规模落地与商业化。具体进展如下:
1)测试版对话机器人 BaRd(已接入 Gemini Pro)正式改名为 Gemini;
2)推出 Gemini 的 Android 版本应用,并将 Gemini 能力整合进 iOS 的 Google 应用,向公众免费开放;
3)在 Android 上,用户可选择让 Gemini 取代原有的语音助手,成为手机的默认语言助手;
4)在 Google One 会员计划中加入 Gemini Advanced 服务,额外付费 10 美元即可访问最强大的 Gemini Ultra 模型;
5)大模型能力很快将接入官方办公与云服务套件中的应用,如 Gmail、Docs、Meet、Cloud 等。
此次不仅直接推出面向个人端的应用,同时将内部多条产品线接入大模型,标志着向技术开放化迈出重要一步。当被问及为何要推出面向公众的产品时, Gemini 体验官表示,这不仅是在讨论最前沿技术,更是在谈论生态系统的转变。
体验官指出,背后的原因一方面是 Gemini 技术本身的强大——从一开始就定位为多模态大模型,是迄今最强的模型,去年底发布后即引发行业震动。
另一方面则是时机已到位,他们相信越来越多人已经准备好首次与这项技术互动,预计许多人将首次使用生成式 AI。
在大模型对话产品全球热潮持续一年之际,正式迈出关键一步。
01 Gemini 推出独立应用,
个人助理市场迎来新选择?
为应对竞争,2023 年 3 月推出的聊天机器人 BaRd 在初期能力并不理想,现场演示亦有失误。为此,团队持续提升模型水平,从轻量级模型到功能更强的 PaLM,再到 Gemini Ultra。去年 12 月 Gemini 发布后,BaRd 宣布将运行在 Gemini Pro 上,这是自推出以来的最大升级。
如今这款产品直接改名为 Gemini,并决定推出独立应用供测试使用,成为公开落地的重要一步。
2 月 8 日 21 点,Gemini 的 Android 版本应用正式上线,且能力已加入 iOS 的官方应用,向公众免费开放。用户可在亚太地区以英语、日语和韩语体验,更多语言版本将陆续推出。
体验官表示,外出时更容易访问 Gemini 是用户的诉求之一,新的移动体验将最新 AI 能力直接带到设备上,使用户无论何时何地都能获得帮助。这也是许多大模型面向个人端应用的典型场景,随时随地与模型互动、获取服务。
不过,更为关键的是,Android 用户可以让 Gemini 替代原有的语音助手,成为手机的默认助手。具体用法是在访问助手时会出现加入 Gemini 作为实验性助手的选项,如同意即可将 Gemini 设为默认助手,现有的 Google 助手入口仍可唤醒 Gemini。
这意味着 Gemini 将具备调用助手完成任务的能力,例如拨打电话、发送信息、设置计时器、控制智能家居等,未来还将继续拓展功能。
在过去一年里,各大模型厂商都在讨论个人智能体的未来,即通过一个智能体自动调动应用,而通过将 Gemini 融入助手生态,展示了这一方向的现实可能。
体验官强调,在 Android 上实现助手界面的自然发展,是迈向真正 AI 助手的第一步,因此将 Gemini 作为手机数字助手的一部分。他表示,这只是开始。
02 Gemini Advanced,
面向消费者的高阶选择
在 Gemini 初次发布时,就提到最强大的 Ultra 模型将通过 BaRd Advanced 提供,但当时尚未有明确收费计划。
2 月起,经过改名的 Gemini Advanced 面向公众开放,但同时推出了收费方案。要接入 Ultra 模型,用户需要订阅每月 19.99 美元的 Google One AI Premium 服务,价格与部分同类产品相近但略低 0.01 美元。
虽然价格看起来与市场同类产品相仿,但在定价与生态整合方面,官方强调其优势在于与现有 Google 应用生态的深度整合,用户可在邮箱、文档、会议等场景中无缝使用大模型能力。
Google One 服务并不新鲜,创立于 2018 年,作为公司旗下的综合会员制服务,提供存储、解锁部分软件的高级功能等。若以国内类比,等效于将多项高阶服务打包为一个会员,同时享有跨应用的高级功能,且该生态拥有庞大的用户基数与付费潜力。
2024 年初,官方宣布 Google One 订阅者已达到亿级规模。
在新 AI Premium 档位上线前,One 专项本身包含三个档位:月费 1.99 美元、2.99 美元和 9.99 美元。新增加的 AI Premium 档位为 19.99 美元,但将赠送原有 9.99 美元档位的全部 Google One 服务。
这意味着原本已购买诸如 Google Meet 高级功能、日历协作等服务的用户,若愿意每月多支付 10 美元,就可以获得最强的大模型能力。
为了黏住这部分用户,官方还针对企业级用户做了定制化功能,除了在专门的聊天窗口访问 Ultra,还计划在邮件、文档和会议等工作流中直接使用大模型能力(源自生产力助手的演进)。
关于 Ultra 模型的表现,官方表示 Gemini Ultra 在多项基准测试中达到领先水平,且在复杂推理与指令理解方面有明显提升,能够辅助编程、角色扮演、看图说话等能力。当前版本似乎未大量整合图片生成或语音对话的多模态能力。
官方也表示,在业内领先的对话系统盲测中,Gemini Advanced 被视为最受欢迎的聊天机器人之一。由于大模型评测缺乏统一标准,最终效果仍需用户自行体验。官方提供两个月的免费试用期,供大家评估 Gemini Advanced 的真实使用感受。
但从当前策略看,此次推出的付费版本重点并非追求“无敌”能力,而是强调与生态应用的深度融合,促使用户在已有应用中更便捷地使用 AI 能力。
比如在撰写邮件时,可以直接在邮件窗口下方让 AI 给出回复建议,比将对话内容复制粘贴到独立聊天界面再输入指令更为高效。AI 与在线会议等应用的深度整合也为提升工作效率提供了广阔空间。
值得关注的是,该团队曾是 Transformer 架构的提出者之一,在 2023 年 AI 领域的热潮中,微软与 OpenAI 的影响力更为显著,但该公司在 AI 领域的动作一直持续且高强度。
2023 年的财报显示, Alphabet 的股价有所波动。分析指出,高度投入 AI 的科技公司最终需要证明投入带来经济回报。微软已在云业务和办公软件等方面实现收益,而 Alphabet 也在逐步兑现潜力。
2024 年初,Alphabet 首次明确宣布 AI 相关的收费产品,当前时机或将成为验证 AI 投入是否转化为可观收益的关键时刻。
