互联网资讯 / 人工智能 · 2024年3月4日

巨型模型的崛起

在现代生活中,修图已经成为一种基本需求。没有拍出适合分享的美照,似乎就等于没有出门。随着AI技术和视觉算法的进步,修图变得更加极致和简单。

当大众对AI作图的理解仍停留在修图和艺术照仿制时,创作行业的从业者发现,AIGC(人工智能生成内容)已经突破了“照片”的界限,正向“视觉艺术”的高度迈进。

2022年,美国科罗拉多州博览会的艺术比赛中,出现了一幅由AI工具Midjourney生成的获奖作品《太空歌剧院》,画面中古典贵妇在穹顶上漫游太空,视觉效果令人震撼,AI作画也因此走进了更广阔的视野。

国内企业在AIGC领域同样积极进取,ChatGPT引发的国产大模型热潮,推动了技术和数据积累较早的企业迅速崛起。

作为美颜和修图行业的先锋,美图公司因AIGC的机遇重新受到关注,股价在市场中多次领跑,并在公司15周年发布会上(10月10日)当天股价大涨11.56%。

美图,大模型大黑马

尽管本周美国AI芯片出口新规导致AI板块出现下跌,美图公司的股价依然展现出较强的韧性。市场的认可不仅源于对其AI技术进步的肯定,也反映了对美图公司在商业模式转型和新生产力工具开发上的期待。

在6月19日的发布会上,美图首次介绍了自研的AI视觉大模型MiRacleVision,并在10月份更新至3.0版本。亲自体验过这款视觉大模型后,《巨潮WAVE》认为这可能是美图未来几年的核心技术之一。

技术助力智能创作

美图的AI视觉大模型具备稳定可控的审美能力。

AI是否能发展出人类的审美能力?0与1的组合是否能创造出真正的美?这是一个值得深思的问题。如果将AI仅视为辅助创作美的工具,那么在某些细节上仍需改进,比如人手的描绘常常不够理想。

在大模型的竞争中,提高精确性和可控性已成为持续迭代的关键。

在观看美图的发布会后,笔者以“少女、活泼、阳光、日系、大笑、卖萌、高清、全身、全景、平拍”为关键词,利用美图的WHEE、百度的文心一言和阿里的通义万相生成了相关图片。

美图,大模型大黑马

从真实感和氛围感来看,美图的WHEE表现突出,生成的少女形象展现出自然、甜美的笑容,更符合真实的东亚女性形象。

由于Midjourney只支持英文输入,笔者以“Asian giRls aRe lively, sunny, and Japanese style, wITh SMiles and cute outfITs”为命令,分别让美图WHEE和Midjourney生成相关图片。

从颜值来看,两位AI女孩各有千秋,但美图WHEE对“sunny”和“SMile”这两个细节的把握更为出色,同时支持中英文双语输入,更加贴合中国用户的需求。

美图,大模型大黑马

在AI生成的人像中,除了整体比例的把握,细节的处理尤为重要。眉毛、眼窝、苹果肌、下颚和锁骨等细节都需要精细调控。美图凭借在图像领域的深厚积累,已在“美学”方面形成了专业优势。

这与美图公司长期以来对美学的追求及对创作者的支持密切相关。

美图不仅通过购买行业数据作为视觉大模型训练的基础素材,还通过设计师主导的方式,充分调动公司设计师资源,参与大模型的训练。

除了数据基础,美图的视觉大模型还具备多种提升生产力的功能,比如在AI作图时的提示词智能联想和精准控制。

这一功能虽然听起来与搜狗输入法相似,但能有效节约时间、提高效率,使得图片和视频制作者能够更精准地实现自己的想法,显著提升宣传物料的竞争力。

美图,大模型大黑马

美图公司希望通过提示词将用户的“想法”与“手法”串联起来,辅助智能创作。例如,通过输入“近/远景”、“顺/逆光”、“大/小光圈”等精准提示词,用户可以轻松掌控光影等细节,调整到理想的成片效果,实现创意的表达。

视觉大模型MiRacleVision 3.0在美学基础上,增强了可控性,使用户能够更细致地调整AI生成图像的效果,从而提升创意工作者的工作效率,实现商业价值。

多行业应用落地

美图的AI技术可广泛应用于多种商业场景。

3月份,小红书上涌现了大量“赛博美女”账号,这些账号为市场带来了新的启示,表明AI作画在市场营销领域的潜力巨大。

通过创造“赛博美女”或其他角色形象,创业者可以吸引流量,并以此为基础,通过广告、电商等成熟的在线商业模式实现变现。

美图,大模型大黑马

从电商的角度来看,大模型的辅助将大幅降低制作商品展示图的门槛和难度。AI创作团队能够生成细节精准、形象生动的高质量商品展示图,降低了原本需大量创意和拍摄的行业成本,提高了利润空间。