苹果在智能手机大模型领域的进展

在主流智能手机制造商中，苹果仍是唯一一家尚未正式推出大模型应用的公司。

2023年，华为率先将大模型技术应用于手机，使得手机能够处理文本生成、信息检索、资料总结、智能编排以及复杂意图理解等任务。随后，小米也推出了其轻量级语言大模型，参数规模分别为13亿和60亿，小米认为轻量级模型在市场中有其独特的需求，这也是智能设备厂商进入大模型领域的必由之路。

紧接着，vivo发布了蓝心大模型，强调轻量化以便于手机的数据处理。荣耀也推出了自研的70亿参数平台级AI大模型，并与百度智能云达成战略合作。几乎同时，OPPO在新发布的Find X7中集成了其首款70亿参数大模型。三星则计划在2024年初推出的Galaxy S24系列中搭载大模型，旗下的笔记本和平板电脑也可能整合该技术。

然而，关于苹果何时在iPhone上搭载大模型的消息依然不明朗。一位业内人士提到，苹果在新技术应用上倾向于充分准备后再推出。苹果CEO库克曾表示，苹果计划在更多产品中整合AI，但需要“深思熟虑”。

尽管如此，苹果已经开始采取行动，推出了名为FeRRet的多模态大语言模型，并开始向新闻及出版机构购买内容版权。iPhone的“AI时刻”正逐步逼近。

追求更快的端侧大语言模型

虽然苹果尚未公开其详细的大模型计划，但其发布的论文《闪存中的大型语言模型：在有限内存下高效的大型语言模型推理》透露了一些技术进展。

目前，大多数大型语言模型（LLM）依赖于强大的云端服务器进行运算。要将这种模型集成到手机中，需要智能手机具备足够的内存。

然而，一个70亿参数的模型需要超过14GB的内存来加载，这超出了大多数设备的能力。即便通过量化压缩模型，终端设备的内存需求依然过高，并且压缩过程可能需要重新训练模型，影响其实际应用。

根据论文内容，苹果的研发团队似乎找到了解决方案——将模型参数存储在闪存中，并在需要时将数据调入DRAM，以解决LLM运行时数据处理量超出DRAM可用容量的问题。

具体而言，苹果采用了两种技术：“窗口化”技术，通过重复使用之前激活的神经元来减少数据传输；“行列捆绑”技术，针对闪存的数据特征，定制访问数据块的顺序，从而增加读取的数据块大小。

研究人员表示，这种方法“为在内存有限的设备上有效推理 LLM 铺平了道路”。与传统的CPU加载方法相比，该框架支持更大模型，并且在CPU和GPU中推理速度分别可提升4-5倍和20-25倍。

更保守的训练策略

与使用爬虫技术获取大模型训练数据的方式不同，苹果采取了更为保守的策略。该公司希望与新闻出版机构进行谈判，以利用其内容开发生成式AI系统。

据报道，苹果最近开始与主要新闻和出版机构谈判，提出至少5000万美元的多年期协议，以获得新闻文章档案的授权，这些机构包括Condé Nast、NBC新闻和IAC。

不过，《纽约时报》报道称，出版商可能要承担苹果使用其内容产生的法律责任，而苹果对于其新闻和生成式人工智能计划的表述则显得模糊。苹果高管在如何获取生成式人工智能产品所需数据方面存在争议，因其注重隐私，苹果不愿意从互联网上直接获取信息，因此与新闻出版商的合作成为另一种选择。

苹果的保守策略对生成式AI的发展既有利也有弊。好处在于，通过在更有针对性的信息集上训练人工智能模型，苹果可能推出更可靠的产品；而弊端则在于，这可能会延迟苹果大模型的推出。

相比之下，OpenAI的做法相对激进。OpenAI用于训练ChatGPT的数据主要来源于网络信息，这导致了信息的不准确性，甚至出现了虚假信息。同时，OpenAI与新闻机构之间的版权争议也是一个无法回避的问题。

例如，《纽约时报》在2023年12月以“违法使用数据、抄袭”为由起诉OpenAI，称其模型几乎能够一字不差地输出《纽约时报》的原文，并且没有提供引用链接，影响其流量和收入。

因此，《纽约时报》认为OpenAI和微软应对此非法使用负责，并要求两家公司销毁所有使用其版权材料的模型和训练数据。

当地时间1月8日，OpenAI在官网上回应了《纽约时报》的版权侵权诉讼，称《纽约时报》的证据来自于多年来在第三方网站上流传的文章，并指责其“故意操纵了提示”。

此前，OpenAI表示，若不使用受版权保护的内容，就无法训练出当今领先的人工智能模型。

主动开源，全栈布局

与以往封闭的iOS生态形成鲜明对比，苹果的FeRRet多模态大语言模型以开源方式发布，这意味着全球的工程师可以在此基础上进一步发展，而苹果也能从中受益。

此外，为了让开发者轻松构建针对苹果芯片优化的机器学习（ML）模型，苹果还推出了名为MLX的开发框架。该框架允许开发者自由选择编码语言，并利用苹果M1和M2代芯片中的统一内存系统，使得开发者可以直接对内存中的数据执行操作，而无需进行数据移动。

尽管节省的时间仅以毫秒计量，但每一次的时间节省累积起来，将加速模型的迭代。

英伟达的高级科学家JiM FAn表示，这可能是苹果在开源人工智能方面的一项重大举措。

由于苹果公司在开源MIT许可下发布了其MLX机器学习框架，苹果的芯片优势将持续在计算量大的机器学习领域保持。苹果的MLX开发框架与其M系列芯片相结合，可能让苹果在大模型时代实现软件与硬件的全栈自研。

据报道，苹果还在开发名为“Ajax”的生成式人工智能模型，预计相当于OpenAI的GPT-n系列。这个拥有2000亿个参数的苹果大语言模型，将成为苹果未来人工智能战略的核心，其性能有望与OpenAI最新模型相媲美。

Ajax将使苹果能够在其设备和应用生态系统中支持新的AI集成与功能，而无需依赖于微软、OpenAI或谷歌等第三方模型提供商。

ad

近期文章

互联网资讯 / 人工智能 · 2024年3月7日

苹果在智能手机大模型领域的进展

You may also like...

互联网资讯 / 人工智能 · 2024年3月7日

You may also like...

云计算和大数据成为了一个行业的标配

36小时内董事会罢免CEO事件梳理

妮可的故事 妮可的成就 妮可的人生经历 妮可的成功之路 妮可的艺术天赋

妮可的故事妮可的成就妮可的人生经历妮可的成功之路妮可的艺术天赋