互联网资讯 / 人工智能 · 2023年11月30日 0

高校联合研发四项AI安全技术被国际会议收录

2月23日消息,阿里安全图灵实验室针对行业内的技术痛点,联合中国科学技术大学、浙江大学、华中科技大学等高校研究人员,共同研发了四项AI安全技术。这些技术涵盖文本变异对抗、图像和视频内容的风险控制以及小样本AI研究,主要成果包括内容安全、文本反垃圾、AI模型的鲁棒性和营商环境治理。这些新一代的核心AI安全技术成果已被国际会议ICASSP(国际声学、语音与信号处理会议)2021收录。

在实际应用中,AI安全技术能够有效应对大量数据带来的主要风险,但对于极少量或新出现的风险,现有的AI模型则往往难以适应。

例如,在2018年进行的扫黄打非专项整治中,出现了一波名为“邪典”的风险(涉及软色情和血腥暴力内容),主要包括对青少年有不良导向的视频。相关内容的清理工作中,受影响的信息数量超过37万条。随着短视频的迅猛发展,这类变异迅速的儿童邪典视频容易再次出现。

积累此类数据以训练原有模型需要一定的时间,而小样本方法正好能够填补这一变异与模型未更新之间的空白。阿里安全图灵实验室的高级算法工程师雍秦指出,运用小样本方法能够有效覆盖这种新风险,维护网络空间的清朗环境。

以往的小样本方法多集中于优化元学习阶段,而本研究则聚焦于小样本方法中的预训练问题。我们的AI安全团队提出了一种简便而有效的方案,通过自监督学习预训练一个更深层次的网络,展现出良好的鲁棒性和泛化能力。雍秦表示。

自监督学习的核心在于学习无标签数据的结构或特性,因此不需要标签结果,这使得构建的AI模型在面对新样本时具有较强的适应能力。

在医疗、生物等行业的安全领域,样本标注面临困难且成本高昂。雍秦坚信,小样本自监督学习能够有效改善这些困境。

阿里安全算法专家李进锋等人常常遇到发送大量垃圾文本的恶意用户,这些黑灰产试图利用对抗手段来规避阿里安全内容风控智能AI系统的检测。

以文本内容为例,恶意用户可以通过变形和变异违规内容,达到绕过模型识别的目的。由于文本对抗的门槛和成本较低,文本内容的风控场景中的对抗异常激烈,这对智能风控体系构成了巨大挑战。

为应对这些挑战,并解决对抗场景中风控模型性能下降的问题,阿里安全图灵实验室与浙江大学共同提出了基于对抗关系图的文本对抗防御技术。

[[[IMG_1]]]
[[[IMG_2]]]
[[[IMG_3]]]
[[[IMG_4]]]
[[[IMG_5]]]
[[[IMG_6]]]