互联网资讯 / 人工智能 · 2023年12月4日 0

新工具包应对复杂研究任务,解决图深度学习问题

深度学习是当前人工智能领域的一个热门方向,然而现有的图深度学习框架如PyG和DGL主要集中于基本操作和模型,难以满足复杂研究任务的需求。最近,德州农工大学的姬水旺教授团队推出了一个可扩展的图深度学习工具包,专门针对复杂研究任务,涵盖图生成、图自监督学习、图神经网络可解释性和3D图深度学习,旨在帮助研究者在算法开发中便捷地使用常用数据集和评估指标进行比较。

新工具包应对复杂研究任务,解决图深度学习问题

图深度学习在处理丰富的图结构数据方面展现了其有效性,并在药物发现、社交网络和物理仿真等多个领域取得了显著进展。大多数图深度学习框架(如PyG和DGL)主要聚焦于基本模块和基础任务,例如节点分类和图分类等。然而,面对更复杂的任务,如图生成和图神经网络的可解释性,研究人员往往需要投入大量精力来实现算法并与基准模型进行比较。

为了解决这一问题,姬水旺教授领导的DIVE(Data integration, Visualization and ExploRation)实验室开发并开源了首个针对复杂研究任务的图深度学习工具包DIG(Dive into GRaphs)。该工具包由16人团队(包括14名博士生、1名本科生和1名指导老师)历时一年完成。与现有的框架不同,DIG专注于为复杂图深度学习任务提供更便捷、更高效且可扩展的算法开发和比较研究平台。

目前,DIG工具包支持四个研究方向:图生成、图自监督学习、图神经网络可解释性和3D图深度学习。每个领域都配备了通用的、可扩展的数据接口、常用算法和评估标准。

新工具包应对复杂研究任务,解决图深度学习问题

项目包含四个研究方向,涵盖18个算法、33个数据集和7类评估指标。基于通用和可扩展的实现,未来可将更多方向和算法集成到DIG中。工具包的整体结构如下图所示:

新工具包应对复杂研究任务,解决图深度学习问题

DIG所涵盖的四个方向包括:

图生成:这一研究方向关注如何基于给定的图数据生成新图。图生成任务在药物和材料开发中具有重要潜力,因此DIG特别考虑了生成分子图的深度学习算法,并实现了相关的评估指标,以评估随机生成、分子性质优化和有约束的分子性质优化。

图自监督学习:自监督学习已扩展至图数据,特定的自监督任务能够帮助模型获取更有效的图特征表示。DIG目前主要实现了基于对比学习的常见图自监督算法,并提供了节点分类和图分类的数据接口及评估指标。

图神经网络可解释性:随着图神经网络在实际应用中的普及,理解模型的可解释性变得至关重要。DIG实现了多种图神经网络解释算法,并为可解释性任务构建了易于人类理解的图数据集,方便后续研究。

3D图深度学习:3D图网络中的节点具备三维位置信息,例如分子中的每个原子都有相对的3D位置。DIG整合了三种最新的3D图深度学习算法,形成统一的3DGN框架,同时提供常见3D分子数据集的统一接口和评估指标。

关键设计准则包括:

通用实现:DIG为每个研究方向提供了通用的数据接口和评估方法,使其成为一个标准化的测试平台。此外,对于可以统一的算法,DIG也提供了通用的实现,例如针对3D图深度学习的3DGN框架和图自监督学习的对比模型框架。

可扩展性和可定制化:借助于通用的实现,研究人员可以方便地集成新的数据集、算法和评估标准。同时,用户可灵活选择数据接口和评估方法,定制实验。因此,DIG可作为研究人员实现新算法与基准算法进行比较的有效平台。