国内首个大模型安全一体化解决方案发布

9月11日消息，今日，蚂蚁集团推出了其大模型安全一体化解决方案“蚁天鉴”。该方案包括大模型安全检测平台“蚁鉴2.0”和大模型风险防御平台“天鉴”两个核心产品，具备多项功能。这是自大模型技术兴起以来，首个能够支持产业级应用的安全检测与防御一体化解决方案。目前，这两款产品已正式对外开放。

蚂蚁集团的工作人员指出，大模型安全问题的根源主要源自三个方面。“蚁天鉴”旨在通过对大模型的安全性检测和智能风险防控，确保大模型在生产和使用过程中的安全性、可控性和可靠性。

根据蚂蚁集团的介绍，“蚁鉴2.0”是业内首个支持文本、图像等全数据类型的AI安全检测平台。该平台从“黑产”的角度出发，利用智能攻击对抗技术，自动生成数百万个诱导性问题，针对生成式大模型进行引导式问答，并实时、自动化地检测大模型的回答，从而24小时不间断地查找大模型的脆弱点和安全隐患。

“蚁鉴2.0”最新的功能实现了对AIGC生成的图像、视频等多模态内容的真伪鉴别和安全性检测，基于生成模型构建了近千万的深度伪造样本，可以迅速判断内容是机器生成还是人工生成，并识别潜在的伦理和道德风险。

而“天鉴”则相当于在大模型外部增加了一个“防护盾”，通过智能风控技术，帮助大模型抵御恶意提问，同时对生成的回答内容进行风险过滤，确保大模型在上线后，从用户输入到生成输出的整体安全防护。

据了解，“天鉴”平台结合了问（人类知识）和答（AI知识）环节的特点，构建了一套护栏防御的智能风控解决方案，支持风险内容的识别、阻断和反制等全链路服务。

此外，“天鉴”平台整合了大数据底座、AI计算平台、智能运营和应用场景，能够实现低成本、快速规模化应用，服务于零售、金融、直播、游戏等使用生成式人工智能的业务场景。

针对数据源头的有害信息和深度黑盒不可控等问题，蚂蚁集团结合“天鉴”平台，在大模型的训练和应用中，通过数据去毒、对齐训练及可解释性研究等手段，确保模型的安全。

互联网资讯 · 2023年12月1日 0