近日,一位日本的宅男大叔佐藤推出了一个AI生成肖像画的网站AI Gahaku,短短10天内用户访问量从零激增至100万,引发了推特上的热议。
这个网站操作简单,只需上传一张人脸照片,便能生成一幅大师级的肖像画。

更令人惊讶的是,佐藤本人是自学成才,展现了令人钦佩的宅男创造力。
佐藤患有阿斯伯格症,这使他在某些领域展现出特殊才能,但在日常生活中却难以适应。
显然,他的专长正是人工智能领域。

pix2pix,TensoRFlow内置的cGAN模型
让佐藤声名鹊起的AI技术,正是闻名遐迩的GAN的变种。
他的人脸肖像生成技术源自于TensoRFlow内置的cGAN中的pix2pix模型。
与GAN的通用性不同,cGAN更侧重于特定场景的应用。例如,AI Gahaku仅能处理人脸照片,若用户上传猫脸,则无法生成结果。
GAN的特点在于其损失函数的自我计算与自动更新,这使得GAN与迁移学习的结合成为可能。近年来,GAN被视为实现迁移学习目标的工具,迁移学习为应用GAN提供了明确指引。
TensoRFlow中的pix2pix模型基于cGAN,专注于图像对图像的转换,已经达到成熟阶段,能够直接用于黑白图像上色、图像风格转化等多种场景。
具体而言,佐藤利用pix2pix模型,专注于生成大师肖像画,这也展示了该模型的强大扩展性。
使用方式完全取决于用户自身的需求。
在佐藤的另一款作品PixelMe中,同样利用pix2pix技术生成8位像素风格的头像,展示了同一模型的多样应用。

当然,生成效果因人而异,毕竟佐藤是在对现有模型进行二次开发,原有的算法和数据结构并未改变,因此性能和效果受到原有模型的局限。
宅男的AI进阶之路
佐藤的人生经历颇为复杂,他从大学退学后,曾做过面包师,也参加过护理学校的培训,但都感觉不合适,最终决心运用自己的才能投身于AI领域。
他立刻开始学习,选择从TensoRFlow入手。
利用Google Colab的计算资源,佐藤从头开始学习TensoRFlow的教程,显然他更适合从事AI而非糕点制作。
在学习过程中,他找到适合自己的方向,即迁移学习与GAN,能够有效实现图像的再生。通过不同的图像数据集进行训练,可以针对特定场景进行学习和生成。
GAN是一种典型的非监督学习方法,其核心原理是两个神经网络进行“对抗”,通过不断优化参数达到最佳结果,形成自我博弈。
这种技术主要应用于计算机视觉领域,这也是佐藤选择使用GAN的原因。
得益于Google的支持,佐藤使用的网站服务器和计算资源费用相对便宜,约为每天20美元,他表示在可接受的范围内,短期内不会考虑商业化。
AI for Everyone!
在成名之后,佐藤依然保持谦逊。
他强调这项工作是出于对自己感兴趣的事情,而非追求经济利益。
出于对技术的热爱,佐藤开启了自己的AI之路,并在两年后成功上线应用。
这种为梦想而不断努力的精神,才是真正值得我们学习的。
毕竟,并非每个人都有勇气去自学AI。
