轻微的调整就可能对AI模型的鲁棒性造成挑战。
在AI的视角下,以下两张图片可能显得毫无关联。

最近,FACEbook AI推出了一个新的Python库——AugLy,专门用于数据增强。
该库支持音频、图像、视频和文本四种模态,提供超过100种数据增强功能,可以对输入内容进行多样化处理。
例如,它可以调整文本的大小写、字体、编码方式,添加标点符号、修改字母顺序、甚至模拟拼写错误。
该项目已经获得了1.8k颗星,且登上了GitHub热榜。
AugLy的设计旨在覆盖现实网络中的具体数据增强,以便生成样本用于模型的训练和测试。
通过处理FACEbook和Instagram等平台上的生活图像和视频,AugLy在统一的库和API下转换所有数据,提供了超过100种数据增强方式。
该库分为四个子库,分别对应音频、图像、视频和文本。
这些子库包含基于函数和类的变换和组合,同时可以选择应用的元数据及其强度。
以图像处理为例,AugLy能够进行裁剪、旋转、添加噪音、模糊和灰度处理等操作。
有用户提出疑问:文本模块是否仅支持英语?
除了包含众多通用的增强功能,AugLy的一个显著特点是提供“互联网用户”类型的数据增强方式。
例如,它可以将图片转换为屏幕截图的样式,更符合日常生活中的常见形式。
借助AugLy进行数据增强训练AI模型,使得内容相同但形式各异的信息能够帮助模型提升鲁棒性。
在进行复制检测、言论审核或版权侵权工作时,经过训练的AI能够更准确地识别用户上传的内容。
此外,AugLy已被用于DeepFake检测挑战赛,以评估模型的鲁棒性。
该Python库引发了网友们的关注,在Reddit上获得了350多个点赞。
一些用户询问:文本模块是否只支持英语?
一位热心网友回应道:
看起来文本模块在很大程度上是对nlpaug的封装,因此AugLy支持其他语言,只需调整几个参数。
还有网友提问,为什么不直接将其加入到PyTorch中?
对此,有人回复:
这样会使安装过程变得很慢,有需要的人可以单独安装,无需让PyTorch变得臃肿。
AugLy要求Python 3.6及以上版本,通过pip安装,但在虚拟环境和系统环境中,还需要使用conda和sudo apt-get命令单独安装Python-Magic。
比较遗憾的是,AugLy目前不支持批量图像输入,开发人员表示将来会完善这一功能。

