用50个三角形勾勒蒙娜丽莎的后现代抽象
现阶段,给 AI 一个短语和 50 个三角形,它就能创作出极简风格的抽象画。
例如输入“a drawing of cat”,就会生成一个棱角分明、冷峻气质的抽象猫形象。

不仅是泛化概念,给出具体词汇,AI 也能据此定向作画。
请示输入“Walt Disney World”,50 个三角形即可重新排布,呈现出风格截然不同的抽象迪士尼城堡。

这可以说是对迪士尼城堡精髓的再现。

上述这类“作品”其实依赖进化策略(ES)与 CLIP 的结合所产生的效果。两者协同工作,通过文字提示和具体图像,让一堆三角形在画布上被重新排布,逐步构建出具备鲜明风格的抽象画。
对比生成结果,可以看到 ES 算法与 CLIP 的结合,实质上是在对三角形的大小、位置、颜色等参数进行迭代优化,使最终图像与给定词汇更吻合。

这一次的效果确实带有一定的后现代艺术气息。
仅用三角形创作的抽象画
从生成过程看,ES 与 CLIP 的协作本质是将一堆随机分布的三角形,通过调整大小、位置与颜色,逐步拼合出与文本描述相符的图像。

具体而言,初始阶段,ES 会在画布上随机给出若干三角形,并以它们的坐标与 RGBA 值作为参数。
进化策略(ES)类似自然选择,依据给定信息不断优化,直到达到满意的解为止。
CLIP 是一个负责对图像进行重排序的模型,它会对 ES 生成的三角形图像与文本描述的相似度打分,并将结果反馈给 ES,从而推动迭代,最终产出艺术作品。

除了通过文本指令生成,也可以直接使用一张图片作为初始信息,仅靠 ES 算法同样能完成作画。
在使用 50 个三角形、迭代 10000 次后,出现了以后现代风格呈现的蒙娜丽莎。

若增加三角形数量,效果通常会更丰富。
在下面的对比中,若三角形数量达到 200,生成的图像细节立刻增多不少。
其中“达尔文”和“蒙娜丽莎”的示例,适配度几乎达到满分。

此外,为提升效果,研究人员还使用了 ClIPUp 优化器。
从对比中可以看出,优化器在迭代 1 万次后的效果,甚至超过基本算法在 56 万次迭代后的表现。

与基于梯度的渲染方法相比,ES 的表现也不容忽视。渲染方法偏重纹理与颜色细化,而 ES 更强调三角形的布局方式。

那么,基于文本指令的生成效果究竟如何?

在“Self”、“HuMan”、“Walt Disney World”等案例中,算法的表现依然出色。随着构图中三角形数量的增加,所呈现的细节也更加丰富。
但在“pictuRe of Tokyo”这个案例中,表现就没有那么理想。研究者认为原因在于算法在生成较深阴影的三角形时还存在困难,因此导致了这一结果。并且面对同一题目,算法往往给出多种可能的答案。
在这几组案例的重复测试中,生成的图像都存在明显差异。

DEMO 可试玩
其实这并非 CLIP 首次“指挥”其他 AI 作画。此前与 GAN 搭配时,图像就能呈现出 CG 艺术风格。

此次的抽象画效果也可以亲自体验。团队已将代码开源,Colab 也提供试玩(链接位于文末)。

这是网友上传的生成图像,效果相当不错,你能认出这是谁吗?
