互联网技术 / 互联网资讯 · 2023年11月8日 0

AI创作中国山水画,线条笔触迷惑观察者

利用生成对抗网络(GAN)进行创作已经不再是新鲜话题。

2019年,英伟达在GTC大会上推出了名为“GauGAN”的人工智能图像生成器,用户只需简单地勾勒几条线条,系统便会自动生成美丽的风景图像。

这一技术采用了生成对抗网络(GAN)模型,广泛应用于图像生成领域。

例如,去年MIT与IBM沃森联合实验室发布的AI PoRtRAIts ARs,允许用户在线将照片转化为中世纪风格,因其受欢迎程度一度导致网站崩溃。

有人可能会问:“这不就是风格迁移吗?”

不完全是,团队特别强调这并非风格迁移,而是AI自主创作,从线条到色调,均以人类艺术家的风格进行创作。

然而,正如东西方文化的巨大差异,在艺术与技术结合的领域,AI似乎更倾向于西方。我们经常看到AI生成的写实主义、后现代甚至抽象艺术作品,但在传统东方艺术上却鲜有表现。

近日,普林斯顿大学的本科生Alice Xue将目光投向了中国山水画。

在她的毕业论文中,开发了一款名为SAPGAN(Sketch-And-PAInt GAN)的AI模型,能够生成传统中国山水画,并因此获得普林斯顿2020优秀毕业论文奖。

论文中提到的一项针对242人的图灵视觉测试显示,SAPGAN创作的作品被误认为人类艺术品的比例高达55%,显著高于基线GAN模型的作品。

与人类创作相似,AI也遵循画草图后上色的步骤。

传统的中国山水画一般包括勾、皴、点、染等步骤,先描绘出大致轮廓,再进行细致渲染。

Alice提出的端到端生成模型遵循这一过程。为此,她构建了两个模型:

 第一阶段:SketchGAN 第二阶段:PAIntGAN

SketchGAN从样本图像中提取高分辨率边缘图像,而PAIntGAN则根据SketchGAN生成完整的山水画。

实验结果令人惊讶。

在最终评估中,242名参与者中有超过一半(55%)认为模型生成的画作是人类创作。

视觉图灵测试的评分显示,参与者判断艺术品是由人还是计算机创作的平均得分为70.5%。

在“审美愉悦”、“艺术构图”、“清晰度”和“创造力”等方面,SAPGAN模型的评分在所有艺术类别中均高于基线模型。与人类作品的最大区别在于“清晰度”。

令人意外的是,母语为汉语的参与者更容易被SAPGAN的作品所迷惑。尽管他们见过不少山水画,但在判断作品是否为SAPGAN创作时,反而更容易犯错。

作者比较了母语为汉语和英语的参与者,研究文化接触对判断的影响。结果显示,汉语参与者的平均得分为49.2%,明显低于英语参与者的73.5%。

换句话说,70%的中文参与者在判断SAPGAN的作品时仍会误认为是人类创作,而整体误判率为55%。这表明,无论参与者对中国文化的熟悉程度如何,他们都难以区分作品的来源。

Alice收集了超过两千幅山水画数据,并在GitHub上公开。

文章中提到的模型是基于一个新的中国传统山水画数据集,该数据集并非来自百度或谷歌,而是由作者亲自收集。

Alice指出,目前山水画数据集在唯一性、图像质量和数量上存在不足。为促进这一领域的发展,她建立了一个由2192幅高质量中国传统山水画组成的新数据集,这些作品均来自普林斯顿艺术博物馆的藏品。

目前,这些有价值的作品尚未被广泛应用于生成艺术研究,作者也已在GitHub上发布了此数据集供公众使用。

数据集链接:

https://Github.coM/Alice x 2020/CHinese-landscape pAInting-Dataset

在撰写论文前,Alice并未接受过机器学习课程,她计划前往Facebook工作。

或许你会认为她是一位“资深程序员”,但Alice表示:“在写这篇论文时,我从未上过机器学习课程,因此经常被‘像我这样的新手能为已有的创新研究做些什么’的问题困扰。但我发现总有有趣的角度来处理问题,因为每个人的兴趣和技能都是独一无二的。”

谈到对其他学生的建议,Alice表示,将数字人文学科融入工作是自然而然的事。找到你感兴趣的主题——不论是19世纪的文学作品还是爵士乐,总有方法可以从中收集数据,进行分析或制作相关的技术工具。

谈及未来规划,Alice表示她准备进入Facebook工作,成为一名软件工程师。

[[[IMG_1]]]

[[[IMG_2]]]