互联网资讯

用50个三角形勾勒蒙娜丽莎的后现代抽象

2024年4月5日 · admin
openmagic ad

现阶段,给 AI 一个短语和 50 个三角形,它就能创作出极简风格的抽象画。

例如输入“a drawing of cat”,就会生成一个棱角分明、冷峻气质的抽象猫形象。

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了

不仅是泛化概念,给出具体词汇,AI 也能据此定向作画。

请示输入“Walt Disney World”,50 个三角形即可重新排布,呈现出风格截然不同的抽象迪士尼城堡。

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了

这可以说是对迪士尼城堡精髓的再现。

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了

上述这类“作品”其实依赖进化策略(ES)与 CLIP 的结合所产生的效果。两者协同工作,通过文字提示和具体图像,让一堆三角形在画布上被重新排布,逐步构建出具备鲜明风格的抽象画。

对比生成结果,可以看到 ES 算法与 CLIP 的结合,实质上是在对三角形的大小、位置、颜色等参数进行迭代优化,使最终图像与给定词汇更吻合。

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了

这一次的效果确实带有一定的后现代艺术气息。

仅用三角形创作的抽象画

从生成过程看,ES 与 CLIP 的协作本质是将一堆随机分布的三角形,通过调整大小、位置与颜色,逐步拼合出与文本描述相符的图像。

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了

具体而言,初始阶段,ES 会在画布上随机给出若干三角形,并以它们的坐标与 RGBA 值作为参数。

进化策略(ES)类似自然选择,依据给定信息不断优化,直到达到满意的解为止。

CLIP 是一个负责对图像进行重排序的模型,它会对 ES 生成的三角形图像与文本描述的相似度打分,并将结果反馈给 ES,从而推动迭代,最终产出艺术作品。

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了

除了通过文本指令生成,也可以直接使用一张图片作为初始信息,仅靠 ES 算法同样能完成作画。

在使用 50 个三角形、迭代 10000 次后,出现了以后现代风格呈现的蒙娜丽莎。

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了

若增加三角形数量,效果通常会更丰富。

在下面的对比中,若三角形数量达到 200,生成的图像细节立刻增多不少。

其中“达尔文”和“蒙娜丽莎”的示例,适配度几乎达到满分。

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了

此外,为提升效果,研究人员还使用了 ClIPUp 优化器。
从对比中可以看出,优化器在迭代 1 万次后的效果,甚至超过基本算法在 56 万次迭代后的表现。

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了

与基于梯度的渲染方法相比,ES 的表现也不容忽视。渲染方法偏重纹理与颜色细化,而 ES 更强调三角形的布局方式。

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了

那么,基于文本指令的生成效果究竟如何?

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了

在“Self”、“HuMan”、“Walt Disney World”等案例中,算法的表现依然出色。随着构图中三角形数量的增加,所呈现的细节也更加丰富。

但在“pictuRe of Tokyo”这个案例中,表现就没有那么理想。研究者认为原因在于算法在生成较深阴影的三角形时还存在困难,因此导致了这一结果。并且面对同一题目,算法往往给出多种可能的答案。

在这几组案例的重复测试中,生成的图像都存在明显差异。

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了
DEMO 可试玩

其实这并非 CLIP 首次“指挥”其他 AI 作画。此前与 GAN 搭配时,图像就能呈现出 CG 艺术风格。

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了

此次的抽象画效果也可以亲自体验。团队已将代码开源,Colab 也提供试玩(链接位于文末)。

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了

这是网友上传的生成图像,效果相当不错,你能认出这是谁吗?

AI用50个三角形画出抽象版蒙娜丽莎,有股后现代的感觉了