10月25日消息,美国当地时间周二,高通正式推出两款新芯片,旨在为智能手机和个人电脑(PC)提供强大的人工智能软件支持,这些芯片能够引入科技行业的前沿大语言模型(LLM),且无需联网。
自2022年底Stable DiFFUSion图像生成器和OpenAI的聊天机器人ChatGPT问世以来,公众对人工智能应用的热情显著提升。这两款“生成式人工智能”应用程序对处理能力的需求极高,迄今为止,主要依赖于高功耗的英伟达图形处理器。
高通此次发布的新芯片包括面向个人电脑和笔记本电脑的X ElITe,以及高端安卓手机的骁龙系列8 Gen 3。
智能手机芯片在处理人工智能模型方面的速度可能引发华硕、索尼等高端安卓手机制造商与苹果iPhone之间的新一轮功能竞争,后者每年都会推出新的人工智能功能。
高通一名高管在采访中表示,最新的骁龙芯片在运行人工智能任务时的速度显著提升,生成图像的时间已从去年的15秒缩短至不足1秒。
高通负责移动业务的高级副总裁亚历克斯·卡图兹安(Alex Katouzian)指出:“如果今天有人去购买手机,他们会关心CPU的速度、内存的大小或摄像头的性能。但在未来两三年,用户将更关注这些设备所具备的人工智能功能。”
尽管人工智能热潮推动了英伟达的股价,但高通却未能充分受益。尽管其智能手机芯片出货量颇丰,自2018年以来也已集成了被称为NPU的人工智能组件。
高通的NPU旨在改善照片质量及其他功能。如今,高通表示其智能手机芯片能够处理更大型的生成式人工智能模型,部分模型参数甚至达到100亿个,尽管这仍低于OpenAI的GPT3,后者拥有约1750亿个参数。
高管表示,若芯片足够快速且内存充足,这类人工智能模型可在设备上运行。他们强调,局部运行大语言模型比云端处理更具优势,因为速度更快且更为私密。高通表示,其芯片能够支持Meta的某个版本LlaMa 2模型,并期待客户(智能手机制造商)开发自有模型,同时高通也在研发自己的人工智能模型。
高通展示了一款可运行免费Stable DiFFUSion人工智能模型的设备,该模型能够根据一串文字生成图像。此外,高通还展示了利用人工智能扩展或填补照片某些部分的能力。
去年,高通的第二代芯片成功运行了相同的模型,但处理时间为15秒,而今年的新芯片则能在半秒内完成这一任务。卡图兹安表示,这将显著提高个人助理等人工智能应用的响应速度。
高通表示,未来的应用程序,如个人语音助手,可以依靠设备自身的人工智能模型进行简单查询,同时将更复杂的问题发送至云端的强大计算机进行处理。高通解释了与微软的密切合作,以确保其芯片能够优化人工智能软件。
卡图兹安表示:“使用这些设备进行人工智能功能的次数越多,客户在微软AzuRe上的支出就越少,AzuRe通常负责高昂的推理功能。这些负担现在可以卸载到本地设备上,从而在混合环境中为用户带来巨大的优势。”
高通还透露,其最新的骁龙系列8 Gen 3将在明年初出现在华硕、索尼等品牌的售价超过500美元的高端安卓设备上,高端芯片的技术最终将拓展至其他设备。
高通X ElITe芯片
高通的新个人电脑芯片X ElITe基于ARM架构,旨在与英特尔的x86芯片竞争,应用于笔记本电脑和台式机。
X ElITe采用了苹果收购Nuvia时的技术,Nuvia由苹果前工程师创办,目前正面临与ARM的法律纠纷。基于该芯片的笔记本电脑预计将在明年中期上市,芯片将使用高通的ORyon核心。高通表示,其性能超过苹果的M2 Max芯片,同时功耗更低。
[[[IMG_1]]]
[[[IMG_2]]]
[[[IMG_3]]]
