中国学者在NeurIPS中的流失率达54%:剑桥AI报告发布
在NeuRIPS接收的论文中,有29%的作者拥有中国大学的本科学位。然而,毕业后有54%的学生选择前往美国攻读研究生学位,其中90%的人最终在美国就业。剑桥大学于2020年发布的《AI全景报告》揭示了人工智能领域一些值得关注的新趋势。

根据机器之心的报道,人工智能作为基础科学与工程实践相结合的技术领域,近年来逐渐融合了更多其他学科。随着数字化的不断推进,人工智能正为技术创新提供强大动力。
剑桥大学的2020版《AI全景报告》是该系列年度报告的第三期,继续采用来自知名科技公司和研究团队的数据。新版报告从多个方面探讨了人工智能领域最近的发展趋势,包括研究、人才、行业动态、政策和未来展望。
该报告的主要作者Nathan BenAich与Ian HogaRth均为剑桥大学的学者。

报告地址:https://www.stateof.AI/
一、人工智能研究进展
尽管人工智能领域的发展伴随着开源框架和活跃的社区,2020年的报告开头仍然强调:AI研究的开放性并没有我们预期的那么高。

近年来,在深度学习框架方面,PyTorch的使用逐渐取代了TensorFlow,成为各大AI顶会论文中研究者的首选。

在GitHub上,基于PyTorch的新研究实现占比约为47%,而TensorFlow则只有18%。
与此同时,随着大规模模型的出现,例如OpenAI的GPT-3,NLP领域的技术进步正在加速。当前,训练每千亿参数的模型的成本在百万美元级别,专家估计实际成本可能超过1000万美元。高昂的训练费用使研究者在探索新方向时面临挑战。

在AI模型对算力的需求不断增加的同时,传统计算架构逐渐接近摩尔定律的极限。MIT等大学的研究表明,若要将ImageNet数据集的分类错误率从11.5%降低到1%,可能需要数百亿美元的投资。
然而,研究者们也在积极探索提升模型效率的方法。OpenAI的数据显示,自2012年以来,训练深度学习神经网络进行ImageNet分类所需的算力每16个月减半。

毫无疑问,GPT-3、BERT等模型使NLP研究进入了新阶段,甚至出现了无监督机器翻译工具,能够将C++函数翻译为Java,准确率达到90%。
技术的快速进步源于人工智能领域的高研究投入。统计数据显示,自2017年起,全球AI相关方法(如深度学习、NLP、计算机视觉、强化学习等)的论文数量每年增长50%,预计到2020年,AI领域的新论文数量将超过21000篇。
不过,当前大多数机器学习应用依然依赖于统计方法,忽视了人类学习的重要组成部分——因果推理。在寻找患者治疗方案等任务中,因果推理被认为是更有效的方法。Judea Pearl和Yoshua Bengio等人工智能领域的先驱相信,因果推理能使机器学习系统更具泛化能力和稳健性,并在决策中发挥更大作用。
二、AI人才:美国占主导
近年来,人工智能领域研究者的分布呈现出新趋势。
人才流动
首先,学术界面临人才流失的挑战,许多教授离开大学前往科技公司工作。2004年至2018年间,谷歌、DeepMind、亚马逊和微软从美国大学聘请了52位终身教授,而卡内基梅隆大学、华盛顿大学和伯克利大学在同一时期失去了38名教授。值得注意的是,仅2018年就有41位AI教授离职。

从AI顶会的角度来看,具有中国教育背景的研究者在近年来为AI领域做出了显著贡献。例如,在2019年的国际顶会NeuRIPS中,接收的论文作者中有29%曾在中国获得本科学位。

然而,从国内大学毕业后继续在NeuRIPS上发表论文的毕业生中,有54%前往美国继续深造。

在人工智能领域,美国依然是国际研究的中心,90%的在美国毕业的留学博士选择留在美国工作。
非美国籍的人工智能博士毕业生更倾向于进入大型科技公司,而美国籍博士毕业生则更可能加入初创公司或学术研究团队。

与此同时,许多在美国获得博士学位的AI毕业生也会前往英国和中国就职。

接下来,从研究机构的角度分析AI领域的现状。

以2019年的NeuRIPS为例,谷歌、斯坦福、卡内基梅隆大学、MIT和微软是发表论文数量最多的五个机构。
人才供不应求
作为当前最受关注的研究领域之一,AI领域的人才需求持续增长,许多顶尖大学正在扩大AI专业的招生规模。例如,斯坦福大学的AI专业学生人数已经是1999-2004年期间的十倍,与2012-2014年相比也翻了一番。尽管如此,来自Indeed的数据表明,招聘职位的数量仍是求职者数量的三倍。
不可避免的是,2020年人工智能领域的人才市场受到了新冠疫情的严重影响。根据领英发布的数据,原本强劲的机器学习职位增长趋势在2月遭遇打击,开始下滑。

三、业界快速发展
人工智能设计的药物已在日本开始进行一期临床试验。在人工智能医疗领域,许多创业公司获得了巨额资金,实现了“平台战略”。

在新冠疫情期间,多家科技公司迅速将AI医疗影像识别技术投入实用化。美国医疗保险和医疗补助服务中心近期提出了基于深度学习的医疗影像产品费用标准,AI系统可以迅速扫描胸透等多种医疗影像,将筛查结果提交给人类专家,排除非敏感因素。
谈到人工智能最引人注目的应用——自动驾驶,自2018年以来,在加利福尼亚州持有自动驾驶汽车测试许可证的66家公司中,只有3家公司被允许在没有安全驾驶员的情况下进行测试,分别是WayMo(谷歌)、NuRo和AutoX。
即使在政策最为开放的加州,自动驾驶汽车的行驶里程相较人类驾驶仍然微不足道——2019年自动驾驶汽车公司的行驶里程比2018年增加了42%,但这仅占2019年拥有驾照的加州驾驶员行驶里程的0.000737%。
在评估汽车自动驾驶的行驶里程时,使用每次人工干预之前的行驶里程并不一定是最客观的标准。在美国的一些州,驾驶员双手完全脱离方向盘的行驶里程并未被记录。
不过,最近我们看到了这一数据的新变化。百度的自动驾驶在人工干预之间的行驶里程达到了18,050英里,超过了WayMo的13,219英里。对于不断加强AI投入的百度而言,最近的投资已开始显现成效。

