最近,前阿里首席AI科学家贾扬清在社交媒体上引发了广泛关注,他分享的一条朋友圈截图指出,某国产大模型实际上是LLaMA架构,只是更换了几个变量名而已。
这是业内人士首次质疑这一现象。在几个月前的Waves大会上,中国人民大学高瓴人工智能学院的卢志武教授也曾表示,所谓“国产大模型的春天”,不过是很多公司在“微调国外底座模型”的假象。
尽管后续有其他学者表达了不同观点,但在争论的背后,一个有关大模型的根本问题浮出水面:大模型的数量越多,是否就越好?
对此,百度创始人李彦宏在11月15日的深圳2023西丽湖论坛上给出了他的见解:“目前中国的大模型数量过多,而基于这些模型开发的AI原生应用却相对较少。”
他指出:“人类迈入AI时代的标志,是出现大量的AI原生应用,而非单纯的大模型。”
大模型的现状
要回答前述问题,首先需要明确我们需要怎样的大模型。
以去年11月底ChatGPT的推出为分界点,国内大模型的发展经历了从寒冬到盛夏的转变。如今,不仅阿里、百度等巨头公司,越来越多的创业公司也开始进入这一领域。截至今年10月,国内已发布238个大模型,而6月份时这一数字仅为79个,四个月内增长了三倍。
然而,正如前文提到的专家质疑,大模型的风口并不容易追赶。大模型的核心优势在于其“智能涌现”的能力,这意味着通过训练,即便没有明确教过的内容,模型仍能学习。例如,在一次演示中,李彦宏要求文心一言根据关键词为一辆新能源汽车生成广告,文心一言在三分钟内完成了竖版广告、五条文案和一段30秒的数字人广告。
实现这一能力的前提是模型的参数规模足够大,训练数据量也要充足,并且能够不断投入以进行迭代。
一方面,这意味着大模型是一个典型的资金密集型行业,要开发出好用、可用的大模型,存在较高的技术和成本门槛。据OpenAI联合创始人布罗克曼等人的测算,训练大模型所需的计算量每三到四个月就会翻一番。业内人士估算,OpenAI训练GPT-3一年的算力成本高达2000万美元。
另一方面,这也使得缺乏“智能涌现”能力的专用大模型难以产生实际价值。在会议上,李彦宏提到许多行业和企业正在购买卡、囤积芯片,试图从头训练自己的专用大模型,但大模型的产业化模式应该是将基础模型的通用能力与行业领域的专业知识相结合。大模型虽然通用但成本高,小模型则能高效应对特定任务,且成本较低。在训练过程中,大模型可以帮助小模型快速生成和标记样本,而小模型则能加速大模型的收敛,从而提升算法性能。
一个例证是文心大模型的API调用量。李彦宏表示:“自8月31日开放以来,文心大模型的API调用量呈指数级增长,国内200多个大模型中,文心的调用量超过了所有其他大模型的总和。”
由此可见,大模型本质上是一个基础底座,类似于PC时代的Windows操作系统或移动互联网时代的安卓和iOS系统。它的特性决定了未来的竞争格局将是一到两个技术底座占据主导地位。因此,李彦宏强调:“不断重复开发基础大模型是对社会资源的极大浪费。”
大模型的价值
业界之所以将大模型视为第四次工业革命的标志,是因为期待其带来的效率和效果的跃迁。
以百度的文心大模型为例,自今年3月发布以来,基于文心大模型3.0的文心一言产品在上个月又推出了4.0版本。与前代产品相比,4.0在理解、生成、逻辑和记忆能力上都有显著提升。例如,在生成能力上,文心一言不仅能生成文字内容,还包括图片、视频和数字人等多模态内容,支持超过200种创作体裁,几乎涵盖所有写作需求。
然而,和许多新技术一样,大模型也面临应用场景的限制,需要探索商业价值的实现路径。正如PC时代的软件和移动终端的应用一样,如果大模型无法形成繁荣的生态,也难以体现其真正价值。这也是大模型价值的关键所在。
李彦宏在会上表示:“在AI原生时代,我们需要的是100万个AI原生应用,而不是100个所谓的大模型。”
这需要从业者共同努力。例如,李彦宏提到,虽然国内有许多大模型,但国外也涌现出数十个基础大模型,且在AI原生应用的探索上也十分活跃,目前已有上千个AI原生应用。此外,微软和Adobe等公司也推出了相应的AI原生应用。
百度一直在推动生态建设,目前其智能云千帆大模型平台2.0的月活企业数量近万家,覆盖金融、教育、制造、能源、政务、交通等多个行业的400多个场景,拥有800万AI开发者。
在PC时代和移动互联网时代,技术变革往往带来了新的机遇。人们的基本需求会因技术的进步而焕发新生。正如在互联网时代,人们未曾想到会有抖音这样的应用改变亿万人的娱乐方式。
李彦宏指出,至今无论是中国还是美国,最优秀的AI原生应用尚未出现。正如移动时代涌现出微信、抖音和Uber等“移动原生”应用,AI原生时代也必将涌现出基于大模型开发的优秀应用。
因此,对于大模型从业者而言,与其花费大量精力在开发大模型上,更好的AI原生应用显然是更大的机会。
迎接AI时代的挑战
在此前的百度世界大会上,李彦宏提到:“企业之间的竞争,不是大鱼吃小鱼,而是快鱼吃慢鱼,决策速度更快的企业更可能获胜。”
这一观点与过去七个月中百度在大模型方面的快速推进相呼应——文心大模型经历了数十次更新,并提出了多个生态计划,率先向全社会开放了大模型应用。
这一逻辑有两个方面。
首先是CEO对业务驱动的关键作用。当前,AI和大模型被广泛视为新的变革技术,麦肯锡预测:大模型及其引发的生成式人工智能有望为全球经济带来约7万亿美元的价值。
然而,企业如何拥抱AI时代呢?李彦宏指出,虽然许多企业对此机会十分重视,但对问题的本质理解不深,认为仅仅搞一个基础模型或挑选一款评分高的大模型就是拥抱AI时代。实际上,评估大模型是否对互联网公司的DAU、用户留存等指标产生正面影响,以及对企业的收入、利润和成本影响,才是根本问题,而这些都是CEO需要关注的。
其次,强大的基础大模型是AI原生应用的动力,而AI原生应用则能推动市场和行业变革。
百度基于自家的文心大模型,不仅对各产品线进行了AI原生化重构,还孵化了全新的AI原生应用。例如,其智能代码助手CoMate,每新增100行代码中,就有20行是AI生成的。借助智能化的提升,AI原生化重构后的产品也取得了明显进展,如百度文库的付费率显著提升。
李彦宏以新能源汽车为例,指出中国新能源车在全球市场的65%份额,得益于国家政策的推动,诸如减免购车税、不限号不限行等策略,有效促进了产业的快速发展。他强调,AI产业同样需要从需求侧和应用层入手,鼓励企业利用大模型开发AI原生应用,以市场需求推动产业进步。
如果说以往几次工业革命中,中国的主题是错过和追赶,那么在大模型崛起的当下,我们至少与国外站在了同一起跑线。我们拥有足够的技术和资源进行竞争,值得思考的是选择怎样的道路。与百模竞争相比,强调AI原生应用或许是更佳的路径。
毕竟,在当下,如何平衡收入与支出,已成为大模型企业们面临的重要挑战。
