互联网资讯 / 人工智能 · 2023年12月11日 0

Bengio新论文引发讨论与争议

机器学习研究的一个核心目标是提高模型的泛化能力。在训练模型时,通常假设训练集与测试集的数据分布相同。

然而,现实世界中的输入数据是动态的,数据分布往往随环境变化而变化。

对于人类而言,这一问题相对容易解决。例如,网络语言迅速发展,但人们能够快速适应并熟练使用。然而,机器学习模型在这方面却面临挑战。

人类能够通过重用已有知识迅速适应新信息。因此,如果将这一思路运用到机器学习中,首先需要弄清楚如何将知识拆分成可重组的模块,并理解如何更改或组合这些模块以适应新任务或数据分布。

针对这一问题,图灵奖得主Yoshua Bengio近期在arXiv上发布了一篇论文,提出了一种模块化架构,由一组独立的模块构成,这些模块之间进行对抗,利用key-value注意力机制发现相关知识。研究人员采用元学习方法对模块和注意力机制的参数进行优化,以强化学习的方式实现对数据分布变化和新任务的快速适应。

图灵奖得主Bengio又出新论文,Reddit崩溃:idea撞车了

该团队研究这种模块化架构能否帮助将知识分解为不可更改且可重用的部分,从而使得模型不仅提高样本效率,还能够在多种任务分布之间实现泛化。

图灵奖得主Bengio又出新论文,Reddit崩溃:idea撞车了

该模型基于循环独立机制(RIMs)架构,该架构包含一组独立且相互竞争的模块。在此框架下,每个模块可以独立通过注意力机制处理输入,并与其他模块进行交互。不同模块通过注意力机制处理输入的不同部分,而模块之间的上下文关系则通过交流注意力进行建立。

图灵奖得主Bengio又出新论文,Reddit崩溃:idea撞车了

研究人员展示了如何利用元学习在不同时间尺度上以不同速度训练网络的组成部分,从而捕捉到底层分布的快速和缓慢变化。

因此,该模型设定了快速学习和慢速学习两个阶段。

在快速学习阶段,模块参数快速更新,以捕捉任务分布中的变化。

在慢速学习阶段,注意力机制的参数更新频率较低,以捕捉任务分布中更稳定的特征。

该团队评估了他们提出的Meta-RIMs网络在miniGRid和BabyAI套件的多种环境下的表现。他们选择平均回报率和平均成功率作为评估标准,并与两个基准模型(Vanilla LSTM模型和模块化网络)进行了比较。

图灵奖得主Bengio又出新论文,Reddit崩溃:idea撞车了

结果表明,所提出的方法在样本效率上有显著提升,并能够更好地适应训练分布的系统性变化。

此外,该方法能够更快地适应新版本,并通过重用类似任务中的知识,以渐进的方式训练强化学习模型,从而形成更有效的知识学习机制。

该研究成功地利用模块化结构中的元学习和稀疏通信来捕捉潜在机制的短期与长期特征,证明了元学习与基于注意力的模块化能够提升样本效率、实现分布外泛化及迁移学习。

ReddIT网友的反应如何?

论文发布后,ReddIT上引发了热烈讨论。

一位网友表示感到沮丧,他研究这个领域已有四年,原本计划今年发表论文,却被提前发表的研究所领先。随后他补充说,虽然工作不完全相同,但非常接近。

图灵奖得主Bengio又出新论文,Reddit崩溃:idea撞车了

此言论引发了众多安慰,许多网友指出,相似的结论可能源自不同的方法,每种方法都有其独特的价值。

还有网友认为,能够与Bengio及其团队相提并论是好事,其他人的不同见解可能会激发新的灵感,促进自己的工作。

知乎上也有网友对此进行了讨论。

图灵奖得主Bengio又出新论文,Reddit崩溃:idea撞车了

有网友表示,两篇论文完全重合,CV领域竞争激烈,自己的研究在大佬的工作面前毫无反抗之力,因为前者的研究几乎无懈可击。他希望有机会能够开辟新领域,而不是填补已有的空白。

目前,深度学习领域的一些研究已发展到拼手速的地步。例如,BERT一经发布,各种基于BERT的研究层出不穷,往往只是验证性工作,未必对同行有启发。

毕竟,牛顿和莱布尼茨在微积分方面的争论至今仍在继续,普通研究者的论文碰撞也是常见现象。

你是否也经历过论文撞车的情况呢?