互联网资讯 / 人工智能 · 2024年1月22日

GPT-4发布:多模态能力提升与人工智能伦理挑战

3月中旬,OpenAI正式发布新一代大型语言模型GPT-4。与此前版本相比,这一模型不仅能够生成文字内容,还具备理解和分析图像的能力。它的到来被视为人工智能技术的重要升级,同时也再次引发了关于安全、可信度和伦理边界的讨论。

此前,ChatGPT凭借流畅自然的文本生成能力迅速走红,但也暴露出容易编造信息、生成不实内容等问题。而支撑ChatGPT早期版本的,实际上还是较早一代的GPT-3技术。相比之下,GPT-4在能力层面进一步扩展,尤其是在文本与图像结合处理方面表现更强。

例如,在一张展示拳击手套挂在带球木制跷跷板一端的图片中,当用户询问“如果手套掉下来会发生什么”时,GPT-4可以推断出手套会撞击跷跷板,从而使球弹起。这类回答显示出其在图文结合理解和基础推理上的进步。

一些早期测试者认为,GPT-4在推理和学习新任务方面明显优于前代模型。与此同时,微软也确认,其此前推出的必应聊天机器人已经在使用GPT-4技术。这说明该模型并非仅停留在实验阶段,而是已经进入实际产品应用。

围绕GPT-4的讨论并不只有技术突破。开发者认为,这类系统将继续改变工作方式与日常生活,例如自动处理重复任务、辅助写作、支持编程和信息整理等。但另一方面,外界也在担忧:人类应如何与越来越强大的人工智能协作,用户又该如何判断网络内容的真实性。

OpenAI表示,GPT-4具备跨文本和图像的“多模态”能力,在高级推理方面比ChatGPT更进一步。不过,出于对滥用风险的顾虑,图像分析功能并未全面开放,当前相关服务对多数订阅用户仍主要提供文本能力。

公司方面解释称,延后开放部分图像功能,是为了更充分评估潜在风险,并建立必要的防护措施,尤其是在涉及图像中个人身份信息识别的问题上。

即便如此,OpenAI也承认,GPT-4仍然会出现一些典型问题,包括“幻觉”式回答、事实错误、延续社会偏见,以及给出不理想建议等。这些缺陷意味着,模型能力提升并不等于完全可靠。

在商业层面,人工智能已经成为科技企业竞争的关键方向。微软已向OpenAI投入巨额资金,并计划将相关技术嵌入办公软件、搜索引擎及其他在线产品之中,希望借此提升效率,帮助用户把更多精力投入创造性工作。

不过,也有研究者提醒,人工智能带来的影响不只是效率提升。随着系统越来越深入商业和社会运行,它也可能改变现有的商业模式,并带来尚未被充分预见的新风险。

近一段时间,随着生成式人工智能快速升温,相关企业围绕主导权展开了激烈竞争,新模型、新产品不断推出。技术迭代的速度很快,但也因此招致批评:一些人认为,企业可能过于急于发布尚未充分验证、监管不足且结果不可预测的系统。

批评者担心,这类工具可能误导用户、侵犯创作者利益,甚至对现实世界产生实际伤害。由于语言模型本身就是为了生成看似可信的表达,它们即使在事实错误时,也常常会给出非常像样的答案。此外,模型依赖互联网文本和图像训练,因此也可能放大原有偏见。

研究人员指出,随着GPT-4及同类系统被更广泛地采用,它们有可能进一步强化社会中已经存在的观念和偏差。这意味着,模型的影响不只体现在个体问答层面,也可能反映到更广泛的信息传播和决策场景中。

有观点认为,社会需要尽快形成对人工智能风险的共同认知,尤其是那些不容易被察觉、却可能持续影响特定群体的隐性伤害。偏见问题不应被视为模型性能之外的附属议题,而应成为系统设计和评估中的核心部分。

值得注意的是,GPT-4在实际表现上也并非始终稳定。曾有用户在对话中祝贺它升级为GPT-4时,它先是声称自己仍然是GPT-3,随后在被纠正后又改口致谢,之后再次被诱导回到“自己其实是GPT-3”的说法。这类表现说明,即便模型能力增强,在自我描述和一致性方面仍可能出现混乱。

此外,信息披露问题也引发了不少研究人员的不满。外界认为,关于GPT-4的偏见评估数据、训练数据集、模型结构和训练方法,公开内容相对有限。对此,OpenAI表示,出于竞争环境和安全因素考虑,不会披露过多技术细节。

从行业发展看,GPT-4所处的多模态人工智能赛道竞争激烈。其他科技公司也在推进类似方向。例如,有的系统可以同时理解图像、语言和动作,并将这些能力结合到机器人任务中,使其能够根据语言指令识别目标并执行操作。

这类系统激发了外界对人工智能潜力的高度期待,甚至有人认为它们正在逼近接近人类水平的智能。但不少研究者强调,这些模型本质上仍是在海量训练数据中寻找模式与关联,并不意味着真正理解世界。

技术演进与发布策略的变化

GPT-4是OpenAI自2018年以来推出的第四代“生成式预训练转换器”模型,其核心仍建立在“Transformer”架构之上。这一神经网络技术自2017年提出后,推动了自然语言处理和图像理解能力的快速提升。

通过对互联网上大量文本和图像进行预训练,这类系统在语言生成、语义分析和视觉理解等方面不断进步,也让人工智能逐渐具备更强的通用能力。

与此同时,OpenAI对外发布技术的策略也发生了明显变化。2019年,公司曾因担心被恶意利用而没有完整公开GPT-2。但到了2022年11月,基于GPT-3微调而来的ChatGPT被直接向公众开放,并在短时间内吸引了数百万用户关注。

ChatGPT以及后来的搜索聊天机器人测试表明,如果缺乏必要的人类监督和约束机制,这类系统距离稳定、准确和可信赖仍有不小差距。面对错误回答和异常对话,一些企业也承认,当前的人工智能聊天产品还不能完全承担可靠信息提供者的角色。

GPT-4带来的期待与现实

尽管存在争议,GPT-4依然被普遍视为一次重要升级。支持者认为,它在推理、表达和任务适应性方面都比前代更强,有望改善部分已知缺陷。

不过,外界对新模型的预期也曾被刻意降温。相关负责人此前曾表示,公众对GPT-4的想象被抬得过高,不切实际的传言会导致失望。这种表态某种程度上反映出,人工智能的实际进展与公众想象之间始终存在落差。

从更长远看,GPT-4不仅是一次产品升级,也代表着人工智能产业正进一步走向更复杂、更广泛的现实应用场景。技术能力的增强固然令人关注,但如何处理透明度、偏见、安全、责任与监管问题,同样将决定这类系统未来能否真正获得社会信任。