互联网资讯 · 2023年12月1日 0

国内首个大模型安全一体化解决方案发布

9月11日消息,今日,蚂蚁集团推出了其大模型安全一体化解决方案“蚁天鉴”。该方案包括大模型安全检测平台“蚁鉴2.0”和大模型风险防御平台“天鉴”两个核心产品,具备多项功能。这是自大模型技术兴起以来,首个能够支持产业级应用的安全检测与防御一体化解决方案。目前,这两款产品已正式对外开放。

蚂蚁集团的工作人员指出,大模型安全问题的根源主要源自三个方面。“蚁天鉴”旨在通过对大模型的安全性检测和智能风险防控,确保大模型在生产和使用过程中的安全性、可控性和可靠性。

根据蚂蚁集团的介绍,“蚁鉴2.0”是业内首个支持文本、图像等全数据类型的AI安全检测平台。该平台从“黑产”的角度出发,利用智能攻击对抗技术,自动生成数百万个诱导性问题,针对生成式大模型进行引导式问答,并实时、自动化地检测大模型的回答,从而24小时不间断地查找大模型的脆弱点和安全隐患。

“蚁鉴2.0”最新的功能实现了对AIGC生成的图像、视频等多模态内容的真伪鉴别和安全性检测,基于生成模型构建了近千万的深度伪造样本,可以迅速判断内容是机器生成还是人工生成,并识别潜在的伦理和道德风险。

而“天鉴”则相当于在大模型外部增加了一个“防护盾”,通过智能风控技术,帮助大模型抵御恶意提问,同时对生成的回答内容进行风险过滤,确保大模型在上线后,从用户输入到生成输出的整体安全防护。

据了解,“天鉴”平台结合了问(人类知识)和答(AI知识)环节的特点,构建了一套护栏防御的智能风控解决方案,支持风险内容的识别、阻断和反制等全链路服务。

此外,“天鉴”平台整合了大数据底座、AI计算平台、智能运营和应用场景,能够实现低成本、快速规模化应用,服务于零售、金融、直播、游戏等使用生成式人工智能的业务场景。

针对数据源头的有害信息和深度黑盒不可控等问题,蚂蚁集团结合“天鉴”平台,在大模型的训练和应用中,通过数据去毒、对齐训练及可解释性研究等手段,确保模型的安全。