互联网资讯 / 人工智能 · 2023年12月14日 0

AI识别盗版能力提升,发布数据增强库提供100多种方式

轻微的调整就可能对AI模型的鲁棒性造成挑战。

在AI的视角下,以下两张图片可能显得毫无关联。

最近,FACEbook AI推出了一个新的Python库——AugLy,专门用于数据增强。

该库支持音频、图像、视频和文本四种模态,提供超过100种数据增强功能,可以对输入内容进行多样化处理。

例如,它可以调整文本的大小写、字体、编码方式,添加标点符号、修改字母顺序、甚至模拟拼写错误。

该项目已经获得了1.8k颗星,且登上了GitHub热榜。

AugLy的设计旨在覆盖现实网络中的具体数据增强,以便生成样本用于模型的训练和测试。

通过处理FACEbook和Instagram等平台上的生活图像和视频,AugLy在统一的库和API下转换所有数据,提供了超过100种数据增强方式。

该库分为四个子库,分别对应音频、图像、视频和文本。

这些子库包含基于函数和类的变换和组合,同时可以选择应用的元数据及其强度。

以图像处理为例,AugLy能够进行裁剪、旋转、添加噪音、模糊和灰度处理等操作。

有用户提出疑问:文本模块是否仅支持英语?

除了包含众多通用的增强功能,AugLy的一个显著特点是提供“互联网用户”类型的数据增强方式。

例如,它可以将图片转换为屏幕截图的样式,更符合日常生活中的常见形式。

借助AugLy进行数据增强训练AI模型,使得内容相同但形式各异的信息能够帮助模型提升鲁棒性。

在进行复制检测、言论审核或版权侵权工作时,经过训练的AI能够更准确地识别用户上传的内容。

此外,AugLy已被用于DeepFake检测挑战赛,以评估模型的鲁棒性。

该Python库引发了网友们的关注,在Reddit上获得了350多个点赞。

一些用户询问:文本模块是否只支持英语?

一位热心网友回应道:

看起来文本模块在很大程度上是对nlpaug的封装,因此AugLy支持其他语言,只需调整几个参数。

还有网友提问,为什么不直接将其加入到PyTorch中?

对此,有人回复:

这样会使安装过程变得很慢,有需要的人可以单独安装,无需让PyTorch变得臃肿。

AugLy要求Python 3.6及以上版本,通过pip安装,但在虚拟环境和系统环境中,还需要使用conda和sudo apt-get命令单独安装Python-Magic。

比较遗憾的是,AugLy目前不支持批量图像输入,开发人员表示将来会完善这一功能。