互联网资讯 / 人工智能 · 2023年11月27日 0

2020年AI技术在10个领域的发展

JeFF Dean 最近发布了一篇详尽的长文,回顾了谷歌在过去一年中的成就与突破,并展望了2021年的工作方向。

回想我20多年前加入谷歌时,我的初衷是希望通过计算机提供高质量和全面的信息搜索服务。如今,面对更为广泛的技术挑战,我们依然坚持着这个初心,那就是组织全球的信息,使之变得可获取且有用。

2020年,全球因新冠疫情而经历了巨大的变革,技术在帮助数十亿人更好地交流、理解世界和完成任务方面发挥了重要作用。我为我们所取得的成就感到自豪,同时也对未来的潜力充满期待。

Google ReSeaRch 致力于解决一系列长期且重大的问题,涵盖从预测新冠病毒传播,到开发算法和自动翻译多种语言,以及减少机器学习模型中的偏见等方面。

以下是今年的一些关键亮点。

新冠病毒与健康

新冠疫情对人们的生活造成了深远的影响,全球的研究人员和开发者齐心协力,开发出技术和工具,以帮助公共卫生官员和政策制定者应对这场危机。

2020年,苹果与谷歌联合推出了暴露通知系统(ENS),这项基于蓝牙的隐私保护技术能够在用户接触到确诊病例时发出提醒。

ENS 补充了传统的接触者追踪工作,已在50多个国家和地区的公共卫生机构中得以应用,以助于遏制病毒的传播。

在流感大流行初期,公共卫生官员强调需要更全面的数据来对抗病毒传播的速度。我们的社区流动性报告提供了对人口流动趋势的匿名追踪,帮助研究人员分析政策如居家令和社交距离的影响,并预测经济影响。

我们的研究团队还利用这种匿名数据来预测 COVID-19 的传播,采用图神经网络替代传统的时间序列模型。

新冠相关的搜索趋势也为研究人员提供了探索症状与时间之间联系的机会,例如嗅觉缺失,这有时是病毒的症状之一。为进一步支持广泛的研究社区,我们推出了谷歌健康研究应用程序,以促进公众参与研究。

谷歌的团队正在为科学界提供工具和资源,帮助他们应对病毒对健康和经济的影响。

我们还致力于帮助识别皮肤疾病,检测老年黄斑变性(在美国和英国是主要的失明原因之一,全球则排名第三),并探索新型非侵入性诊断方法,例如从视网膜图像中检测贫血迹象。

今年,我们展示了如何利用相同的技术来探测人类基因组,谷歌的开源工具 DeepVaRiant 使用卷积神经网络分析基因组测序数据,识别基因组变异,并在 FDA 的多个类别中表现出最佳的准确性。丹纳-法伯癌症研究所的一项研究采用该工具,在2367名癌症患者中,前列腺癌和黑色素瘤的遗传变异诊断率提高了14%。

天气、环境及气候变化

机器学习正在帮助我们更好地理解环境,并在日常生活和灾难情况下提供有用的预测。

在天气与降水预测方面,基于计算物理的模型如 NOAA 的 HRRR 一直占据主导地位。我们已经证明,基于机器学习的预报系统能够以更高的空间分辨率预测降水情况,提供更为准确的短期预报。

我们开发的 HydRoNets 技术使用神经网络对真实河流系统进行建模,以更准确地理解上游水位与下游洪水之间的相互作用,从而提高水位预测和洪水预报的准确性。借助这些技术,我们将印度和孟加拉的洪水警报覆盖范围扩大了20倍,保护了2亿多人的生命财产安全。

可访问性

机器学习为提高可访问性开辟了新的可能,例如,我们推出的 Lookout 安卓应用程序,能够帮助视力受损的用户识别包装食品,无论是在超市还是自家厨房。

Lookout背后的机器学习系统展示了一个功能强大且紧凑的模型,能够在近200万个产品中实时完成这一任务。

此外,使用手语交流的人在视频会议中面临挑战,因为基于音频的扬声器检测系统无法识别他们的手语。为了解决这一问题,我们开发了一种实时手语检测模型,为视频会议系统提供了识别手语者的机制。

机器学习在其他领域的应用

在2020年,我们与FlyEM团队合作,发布了果蝇半脑连接体,这是一种高分辨率的脑连接图谱,采用大规模机器学习模型处理高分辨率电子显微镜成像的脑组织。这些连接体数据将帮助神经科学家进行多项研究,推动我们对大脑运作的理解。

负责任的人工智能

为了更好地理解语言模型的运作,我们开发了语言可解释性工具(LIT),使用户能够交互式地探索和分析语言模型的决策过程。

我们还引入了技术来测量预训练语言模型中的性别相关性,并在谷歌翻译中减少性别偏见。

为帮助非专业人士解释机器学习结果,我们扩展了2019年推出的 TCAV 技术,提供了一整套完整的概念模型,帮助用户理解预测的构成。

自然语言理解

理解语言是我们今年取得显著进展的领域之一。谷歌及其他公司的研究大多基于 tRansfoRMeR,这是一种为解决语言问题而专门设计的神经网络模型,逐渐被应用到图像、视频、语音、蛋白质折叠等更广泛的领域。

2020年,我们介绍了 Meena,一个可以与人进行各种主题对话的聊天机器人。

机器学习算法

谷歌仍在积极推动无监督学习的发展,2020年开发的 SiMCLR 进一步推进了自监督和半监督学习技术。

通过不同的自监督方法(在 imageNet 上预训练),我们对 imageClaSS 分类器进行训练,提升其在 imageNet 上的准确性。

强化学习

通过学习其他主体并改进探索,谷歌提升了强化学习算法的效率。

我们今年的重点是离线强化学习,依赖固定的先前数据集(如先前实验或人类演示),将其扩展到无法实时收集训练数据的应用中。研究者们为强化学习引入对偶方法,并与更广泛的社区合作,通过发布开源基准数据集和 AtaRi 的 DQN 数据集来解决相关问题。

通过学徒制学习,我们也在向其他代理学习,从而提升样本效率。

需要指出的是,将强化学习应用于复杂的实际问题仍然是一个重大挑战。

AutoML

这一研究领域活跃且充满前景。

在 AutoML-ZeRo 中,我们采取了一种新方法,为演化算法提供了由基本运算(如加法、减法、变量赋值和矩阵乘法)组成的搜索空间,以观察是否能从零开始发展出现代机器学习算法。

然而,有效的算法实在不多。如下图所示,该系统重新塑造了过去30年间许多重要的机器学习发现。

更好地理解机器学习算法和模型

随着神经网络变得更宽更深,它们的训练速度加快,泛化能力也得到了提升。这是深度学习中的一项核心秘密,因为经典学习理论表明,大型网络往往会过拟合。

在无限宽的情况下,神经网络呈现出令人惊讶的简单形式,并由神经网络高斯过程(NNGP)或神经切线核(NTK)进行描述。谷歌的研究人员从理论和实验的角度研究了这一现象,并发布了 NeuRal Tangents,这是一个用 JAX 编写的开源软件库,允许研究人员构建和训练无限宽度的神经网络。

机器感知

对我们周围世界的感知能力,包括对视觉、听觉和多模态输入的理解、建模与行动,仍然是一个充满潜力的研究领域,对我们的日常生活将产生重大影响。

在2020年,深度学习将3D计算机视觉与计算机图形学更紧密地结合在一起。CvxNet、3D形状的深度隐含函数、神经体素渲染和 CoReNet 等都是这一方向的实例。此外,我们与加州大学伯克利分校合作的研究展示了如何将户外场景分解为时空变化的照明和永久场景。

[[[IMG_1]]]

[[[IMG_2]]]

[[[IMG_3]]]

[[[IMG_4]]]