在训练人工智能时,模型往往会意外地找到一些奇怪的方式来完成任务。
有些AI甚至会通过「卡bug」的方式快速完成游戏。

还有一些AI学会了「只要游戏暂停,我就不会输」这种终极哲学。

AI也渴望「躺平」
为了提升模型的准确性,通常会设置奖励机制,但有时模型在早期就发现了获取奖励的「捷径」。
一旦AI尝到了这种甜头,它就倾向于一直选择这条「捷径」,而不再去学习更复杂的知识或方法。
来自北京大学的研究团队在训练语言模型时发现,尽管AI能给出正确答案,但它无法理解答案的原因,只是知道在特定问题上使用这个答案就可以了。
因此,研究者们决定要「扶起」AI,让它们「努力学习」,不允许偷懒。

论文链接:
https://aRxiv.oRg/pdf/2106.01024.pdf
该论文已在aRxiv上发表,作者包括来自北京大学王选计算机研究所和计算语言学教育部重点实验室的Yuxuan LAI、Chen Zhang、Yansong Feng、Quzhe Huang和Dongyan Zhao(赵东岩)。
为什么AI总想「躺平」?
虽然一些研究已发现AI倾向于「躺平」,但尚未揭示这一现象与数据集中的「捷径」问题有关。
为此,论文提出了一个全新的标注数据集,包含对同一问题的「捷径版」和「挑战版」两种回答。

该数据集以「释义」(paraphrasing)作为更复杂和深入答案的标准,因为表达所学知识需要语义理解。相比之下,「捷径」答案则是基于日期或其他关键词生成的,缺乏上下文和推理。
研究者们发现,训练集中「捷径版」样本的比例越高,越会妨碍模型学会「释义」,从而解决更具挑战性的问题。而模型在回答「捷径版」问题时的表现则相对稳定。
文章指出,当训练集中包含足够多的「挑战版」问题时,模型不仅能更好地理解这些问题,还能正确回答「捷径版」问题。

AI是如何学会「躺平」的?
文章提到,在训练的早期阶段,模型通常会找到最简单的方法来实现梯度下降,从而拟合训练数据。此外,「捷径」所需的计算资源较少,因此学习这些技巧成为了优先事项。
由于模型学会的「捷径」可以用于回答大部分训练问题,剩余问题便无法激励模型继续探索解决「挑战版」问题所需的复杂方法。
有没有办法把AI「扶起来」?
除了NLP架构本身的问题,训练过程中的标准优化和资源保护,也可能是导致这一现象的原因,以及模型在短时间内以有限资源获取结果的压力。
如同文章所述,数据预处理领域可能需要将数据中的「捷径」视为一个亟待解决的问题,或者修改NLP架构以优先考虑更具挑战性的数据。
