互联网资讯 / 人工智能 · 2024年1月18日

向外部开发者开放的聊天与语音 API

相关公司宣布推出 ChatGPT API 与 WhISPeR API,开发者可以通过接口将这两种模型嵌入到自家应用和产品中。

此外,该公司表示,第三方开发者通过 API 也能将 ChatGPT 集成到自己的应用和服务中。

ChatGPT 是一款新型的 AI 聊天机器人,能够根据用户需求快速生成文章、故事、歌词、散文、笑话,甚至代码,并回答各类问题。

自上线以来,ChatGPT 在网络上掀起热潮,发布后短短几天就吸引了超过 100 万用户。上线两个月后,用户数量突破 1 亿,成为历史上增长最快的消费者应用之一。

除了推出 ChatGPT API,相关公司还将推出 WhISPeR API。WhISPeR 是一款由人工智能驱动的语音转文本模型,收费为每分钟 0.006 美元。

官方表示,WhISPeR 能实现多语言转录,并可把这些语言翻译成英文。它支持多种音视频格式,包括 M4A、MP3、MP4、MPEG、MPGA、WAV 和 WEBM。

WhISPeR 也存在局限,尤其是在“预测下一个单词”的方面。官方警告称,转录结果中可能包含实际并未说出的单词,原因在于模型在尝试预测音频中的下一个单词时也在转录原始音频记录本身。

尽管在发布时被视为重要进展,但由于实现难度与成本因素,该模型的采用速度明显慢于 ChatGPT。