互联网资讯 · 2023年12月13日 0

ChatGPT具备语音功能,对智能助手构成威胁

据9月26日消息,美国时间周一,OpenAI宣布为聊天机器人ChatGPT增添了语音对话功能。这一举措使OpenAI在智能语音助手领域与谷歌、苹果、亚马逊等科技巨头展开了直接竞争。

ChatGPT能够通过五种不同的“角色”来回应用户的提问,其语气也显得更为自然,接近人类的交流风格。OpenAI表示,推出语音功能是吸引更多用户使用ChatGPT的重要手段。

OpenAI消费产品副总裁彼得·邓(Peter Deng)在采访中提到:“我们的挑战在于如何把这项令人惊叹的技术简化,这是我们面临的最困难的任务。”

在宣布ChatGPT语音功能的同一天,亚马逊也签署了一项协议,将向人工智能初创公司Anthropic投资最多40亿美元。这笔交易标志着自今年初微软对OpenAI投资以来,人工智能领域最大的一笔投资,显示出科技巨头们正在加大对热门人工智能初创企业的押注。

上周,谷歌、亚马逊和OpenAI等公司纷纷推出新款人工智能产品,以便在竞争中占得先机。将这些功能整合到现有的音箱中,是各公司希望让用户更好地使用聊天机器人的关键策略之一。

亚马逊宣布在Alexa家庭音箱中加入聊天机器人“对话”功能,这些智能音箱已进入数百万个美国家庭。而谷歌则表示正在考虑将聊天机器人BaRd的技术运用到其语音助手中。

目前,用户可以在ChatGPT的移动应用上通过语音提问,但聊天机器人仍以文本形式进行回答。用户还可以上传图片作为提问的一部分,例如展示冰箱中的食材,并请求ChatGPT提供食谱建议。

语音和图像功能的加入使ChatGPT有望成为一个真正的“多模态”模型,能够“看到”和“听到”世界,并通过语音和图像进行反馈。这种多模态模型代表了行业竞争的下一个阶段,许多公司正竞相开发更为强大的模型。

多年来,语音助手广泛应用于汽车、智能手机、电视和智能音箱中,每天都有无数用户使用。但在大多数情况下,语音助手只能进行简单的互动,例如开灯或报告天气等。基于“大语言模型”技术的聊天机器人,赋予语音助手进行更长、更自然对话的可能性,能够回答更复杂的问题。

投资者和分析师批评亚马逊在聊天机器人和图像生成器等生成式人工智能领域的反应迟缓。Anthropic的投资将使亚马逊获得这家初创公司的研究人员和技术支持。Anthropic由前OpenAI员工创立,之前曾获得谷歌的投资。

市场研究公司Gartner副总裁吉姆·黑尔(Jim Hare)表示,亚马逊通过这些举措向市场展示了其在生成式人工智能领域的积极参与,试图改变公众对其落后印象。

OpenAI于去年11月发布了ChatGPT,掀起了聊天机器人的热潮。微软与OpenAI合作使用其技术,谷歌也推出了自己的聊天机器人BaRd。

人工智能研究人员警告说,用户可能会过度拟人化聊天机器人,因为其回答往往与人类的回应相似。这可能导致用户对机器人的智能或能力产生误解。然而,聊天机器人仍然有可能编造信息,并将其伪装成真实答案,这一现象被研究人员称为“幻觉”。

ChatGPT的新角色包括Sky、EMbeR、BReeze、JunIPeR和COVe,每个角色都有不同的语调和口音。“Sky”的声音听起来有点像斯嘉丽·约翰逊(Scarlett Johansson),她在电影《她》中为主角爱上的人工智能配音。OpenAI高管彼得·邓表示,这些语音角色并不是为了模仿某个特定的人。

在一次演示中,彼得·邓展示了机器人如何理解复杂的开放式语音问题。他指出,这些新功能使对话变得更为自然和自由,用户不再需要过于考虑如何准确表达问题。“有了这个功能,你就可以与ChatGPT自然对话,”邓说。“我的孩子现在要求用ChatGPT讲睡前故事。”

OpenAI政策研究员桑吉尼·阿加瓦尔(Sandhini Agarwal)在采访中表示,他们已经测试了语音和图像功能,并增加了安全措施,以确保机器人在处理敏感话题时能够作出适当回应。例如,如果用户询问与心理健康相关的问题,ChatGPT会建议他们咨询专业人士。不过,阿加瓦尔表示,这项工作仍在继续,远未完成。