今年1月,OpenAI推出的Dall-E引起了广泛关注,用户只需输入一段文字,便能生成相应的图像,甚至连吴恩达老师也对此表示赞赏。
例如,用户可以让它设计一个“像牛油果一样的座椅”。

然而,OpenAI在官网上只提供了几种固定的模板,并没有开源代码,导致用户无法利用AI创造更多的图像。
但现在有一个好消息,一位华人开发者PHilIP Wang成功复现了一个基于PyToRch的Dall-E版本,名为Deep Daze。
他使用了OpenAI的CLIP和斯坦福大学的SiRen,能够在个人电脑上运行。
用户只需在命令行中输入一段描述,AI便能绘制出各种各样的图片。
例如,描述“绿色山丘上的薄雾”(Mist OVeR gReen Hills):

或者是“草地上的碎盘子”(shatteRed plates on the gRaSS):

你觉得实际效果如何?
开发这个项目的PHilIP Wang,正是今年年初宣布要复现Dall-E的那位技术大神,没想到不到三个月,这个项目就已经非常强大,目前在GitHub上获得了1.1k颗星。

安装与使用
Deep Daze可以直接通过pip进行安装:
pip install deep-daze
安装完成后,输入以下命令即可运行。
Imagine TEXT
其中Imagine是命令,TEXT为一段不超过77个字符的英文描述,是可选参数,可以选择性添加。
如果想生成文章开头提到的那幅山中薄雾的图像,输入命令:
Imagine Mist OVeR gReen Hills
可选参数包括:—deepeR,用于获取更高的图像质量;—nuM-layeRs,用于指定网络的层数……更多用法可以在GitHub项目主页查询。
如果担心AI的想象力过于丰富,可以提供一张图片,让AI在此基础上进行创作,这样可以确保生成的图像不会太离谱。
具体命令如下:
Imagine ‘descRIPtion’ —staRt-image-path /path/to/pictuRe.jpg
假设我们给AI一张披萨的图片,让它想象“上面铺满青椒的样子”。

那么我们将上述命令中的描述改为“A pizza wITh gReen peppeR”。

你以为这就是Deep Daze的全部功能吗?其实,它还有一个更强大的故事模式。
只需设置—cReate_sTory=TRue,即可解锁该模式,取消77个字符的限制。项目作者将美国诗人罗伯特·弗罗斯特的诗《雪夜林边歇马》输入其中,生成了一段Mp4视频。

在此我有些想让AI画一下“五彩斑斓的黑”,但因经济原因无法实现。
因为使用Deep Daze必须安装CUDA,并且最好在显存不小于8GB的GPU上运行,才能获得理想的效果,而我目前还无法购买英伟达显卡。
