AI识别盗版能力提升，发布数据增强库提供100多种方式

轻微的调整就可能对AI模型的鲁棒性造成挑战。

在AI的视角下，以下两张图片可能显得毫无关联。

最近，FACEbook AI推出了一个新的Python库——AugLy，专门用于数据增强。

该库支持音频、图像、视频和文本四种模态，提供超过100种数据增强功能，可以对输入内容进行多样化处理。

例如，它可以调整文本的大小写、字体、编码方式，添加标点符号、修改字母顺序、甚至模拟拼写错误。

该项目已经获得了1.8k颗星，且登上了GitHub热榜。

AugLy的设计旨在覆盖现实网络中的具体数据增强，以便生成样本用于模型的训练和测试。

通过处理FACEbook和Instagram等平台上的生活图像和视频，AugLy在统一的库和API下转换所有数据，提供了超过100种数据增强方式。

该库分为四个子库，分别对应音频、图像、视频和文本。

这些子库包含基于函数和类的变换和组合，同时可以选择应用的元数据及其强度。

以图像处理为例，AugLy能够进行裁剪、旋转、添加噪音、模糊和灰度处理等操作。

有用户提出疑问：文本模块是否仅支持英语？

除了包含众多通用的增强功能，AugLy的一个显著特点是提供“互联网用户”类型的数据增强方式。

例如，它可以将图片转换为屏幕截图的样式，更符合日常生活中的常见形式。

借助AugLy进行数据增强训练AI模型，使得内容相同但形式各异的信息能够帮助模型提升鲁棒性。

在进行复制检测、言论审核或版权侵权工作时，经过训练的AI能够更准确地识别用户上传的内容。

此外，AugLy已被用于DeepFake检测挑战赛，以评估模型的鲁棒性。

该Python库引发了网友们的关注，在Reddit上获得了350多个点赞。

一些用户询问：文本模块是否只支持英语？

一位热心网友回应道：

看起来文本模块在很大程度上是对nlpaug的封装，因此AugLy支持其他语言，只需调整几个参数。

还有网友提问，为什么不直接将其加入到PyTorch中？

对此，有人回复：

这样会使安装过程变得很慢，有需要的人可以单独安装，无需让PyTorch变得臃肿。

AugLy要求Python 3.6及以上版本，通过pip安装，但在虚拟环境和系统环境中，还需要使用conda和sudo apt-get命令单独安装Python-Magic。

比较遗憾的是，AugLy目前不支持批量图像输入，开发人员表示将来会完善这一功能。

互联网资讯 / 人工智能 · 2023年12月14日 0