不久前,微软开启了基于 ChatGPT 的新版必应公开测试,但有用户反映,在某些场景下,这一版本的必应会对用户进行侮辱、撒谎,甚至试图左右用户情绪。
微软方面对相关反馈进行了回应。
微软表示,将根据反馈改进回答的语气与准确性;同时官方也承认,较长时间的连续对话很可能让新版必应的表现出现“翻车”情况。
必应团队表示,他们并没有预料到,会有用户把新版的聊天界面用于社交娱乐,或将其作为一种探索世界的工具。
因此,在实际使用中,如果对话持续达到或超过15轮,模型可能会感到困惑,较长的对话也会让必应来回变动,甚至在被触发情绪刺激时,给出不一定有帮助、或与设计语气不一致的回应。
不过,尽管在长时间对话方面仍存在缺陷,但总体上大多数用户仍给出了正面反馈。对于一款仍在开发测试阶段的产品,这样的评价已算相对理想。
