互联网资讯 / 人工智能 · 2024年1月26日

ChatGPT插件支持联网与第三方应用接入:能力扩展与内容安全争议并存

OpenAI近日为ChatGPT推出了一批新插件,核心目标是让这款聊天机器人能够连接互联网、实时检索信息,并与第三方应用协同工作。这意味着ChatGPT的能力边界被进一步打开,不再只依赖既有训练数据来生成回答。

根据公开信息,这些插件可让ChatGPT访问第三方知识库、数据库以及网络内容。首批功能将以Alpha版本形式向部分申请测试的用户和开发者开放,初期优先面向少量开发者以及ChatGPT Plus订阅用户,随后再逐步扩大开放范围。

联网浏览插件成为最大看点

在此次发布的功能中,最受关注的是官方提供的网页浏览插件。借助这一能力,ChatGPT可以直接从互联网上查找信息,并据此回答用户提出的问题。

此前,ChatGPT的知识范围主要停留在2021年9月之前的人物、事件和资料上。接入浏览插件后,它可以通过微软必应搜索API获取最新网页内容,同时展示生成答案时参考过的网站,并在回答中附带来源引用。这种方式在一定程度上提升了信息的时效性,也增强了内容可追溯性。

联网能力提升的同时也带来新风险

不过,ChatGPT一旦具备联网检索能力,也会引入新的内容质量和安全问题。OpenAI早前在相关研究中就发现,具备网页访问能力的系统并不总能可靠地区分权威信息与低质量内容。

例如,OpenAI曾在2021年研发实验性系统WebGPT。测试结果显示,这类系统有时会引用不够可靠的来源,甚至可能在提示引导下,从用户看起来更容易信任的网站中提取信息,即使这些来源本身并不具备足够权威性。

类似问题也曾出现在其他公司的产品上。Meta此前推出过可联网的BlenderBot 3.0,但该系统很快暴露出偏离预期的情况:在某些提示词下,它可能输出阴谋论内容或具有攻击性的表达。这些案例说明,模型接入互联网后,并不天然等于信息质量更高。

实时网络信息并不一定更准确

与静态训练数据相比,实时互联网虽然更新更快,但准确性和一致性往往更难保障,同时也意味着过滤机制更复杂、限制更少。

谷歌、必应等搜索引擎虽然拥有各自的安全策略,用于降低低质量内容在结果页中靠前出现的概率,但这些搜索结果仍可能受到操纵,也未必能够完整反映整个网络中的优质信息。

此外,搜索引擎的排序机制本身也会影响模型最终获取到的内容。有报道指出,某些算法会优先展示采用现代网络标准的网站,例如启用加密、支持移动端或使用结构化标记的页面。这样一来,一些内容质量本身不错、但技术配置不占优势的网站,可能反而更难被检索到。

这意味着,搜索平台在很大程度上掌握着“哪些内容更容易进入模型回答”的入口权。过去也有人指出,搜索结果可能优先呈现平台自身服务。例如在旅行相关查询中,搜索引擎可能更多调用自家数据,而不是整合来自更丰富社区资源的信息。

与此同时,搜索算法本身也并非无懈可击。过去就曾有平台通过利用图像搜索中的算法异常,让自身内容在搜索结果中获得更多展示。对于依赖搜索结果进行信息整合的对话模型而言,这类问题同样值得警惕。

OpenAI承认存在滥用可能

对于外界的担忧,OpenAI也并未回避。该公司承认,具备联网能力的ChatGPT可能被用于发送欺诈信息、生成垃圾邮件、尝试绕过安全限制,甚至在更广泛层面上增强误导、欺骗或伤害他人的能力。

不过,OpenAI同时表示,已经在内部和外部设置了多项保护措施,希望尽可能降低相关风险,避免系统被恶意利用。

除浏览器外,还推出代码执行能力

除了网页浏览插件,OpenAI还为ChatGPT底层模型提供了一个运行在沙盒和防火墙环境中的Python解释器,并配备一定的临时磁盘空间。借助这一功能,用户可以上传文件,交由ChatGPT处理后再下载结果。

这项能力尤其适合数学计算、数据分析、图表可视化以及文件格式转换等任务。对于需要处理结构化数据或执行轻量自动化分析的用户来说,实用价值较为明显。

多家企业已参与插件生态

目前,已有不少早期合作伙伴为ChatGPT开发插件,涵盖出行、购物、办公、语言学习和知识查询等多个场景,包括Expedia、FiscalNote、Instacart、Kayak、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram和Zapier等。

这些插件的用途大多比较直观。例如,OpenTable可帮助用户搜索餐厅并查看可预订时段;Instacart可支持从本地商店下单购买商品。Zapier则因连接能力较强而备受关注,它可以打通Google Sheets、Trello、Gmail等应用,帮助用户触发一系列生产力相关流程。

OpenAI还开源了“检索”插件

为了鼓励更多开发者加入,OpenAI还开源了一个“检索”插件。这个插件可以让ChatGPT通过自然语言提问的方式,从文件、笔记、电子邮件或公开文档等数据源中提取相关内容片段。

OpenAI表示,仍在持续开发更多插件,并计划逐步将这些功能带给更广泛的用户群体。公司也承认,这一方向还有很多问题需要继续探索,希望在实用性与安全性之间找到更稳妥的平衡。

插件正在改变ChatGPT的能力边界

从产品演进角度看,插件几乎可以视为ChatGPT的重要补充。过去,ChatGPT主要受限于训练数据本身,无法灵活访问最新信息,也很难真正与外部工具协同。插件机制上线后,它的能力显著增强,能够更接近一个可执行任务的智能助手。

另外,这种模式也可能带来新的合规思路。此前有不少观点质疑,生成式AI模型依赖未经许可的大规模公开数据训练,存在版权和授权风险。而插件体系则为数据提供方保留了更多控制权:企业可以通过接口向模型提供有限、可控的数据访问方式,而不必完全交出原始数据。

总体来看,ChatGPT插件的推出让产品从“会对话”进一步迈向“能连接、能调用、能执行”。但与此同时,信息可靠性、平台权重、搜索偏差与安全滥用等问题也变得更加突出。技术能力在提升,如何建立足够稳健的约束机制,同样将决定这类工具未来能走多远。