【TechWeb】10月9日,美图公司庆祝成立15周年,并推出了自研的AI视觉大模型MiRacleVision(奇想智能)3.0版本。全新版本将在100天后全面应用于美图旗下的影像与设计产品,并将为电商、广告、游戏、动漫、影视五大行业提供支持。

美图视觉大模型的100天进化:奇思妙想与智能创作
在美图公司的15周年庆典上,创始人兼首席执行官吴欣鸿发布了MiRacleVision 3.0版本。

美图公司创始人、董事长兼首席执行官吴欣鸿
吴欣鸿表示,三个月前,MiRacleVision的绘画水平还处于初级阶段,而如今3.0版本已经能够描绘出真实细腻的画面细节,用户可以通过AI视觉创作工具“WHEE”官网进行体验。

吴欣鸿将自己15岁的绘画作品与即将发布的美图视觉大模型进行对比,认为训练AI与人类学习绘画有很多相通之处。通过充分学习不同的绘画风格和技巧,AI能够创作出具有独特性的作品。

美图公司将MiRacleVision的核心能力拆解为“奇思妙想”和“智能创作”两大特性。
在“奇思妙想”层面,MiRacleVision通过“提示词智能联想”功能降低用户使用门槛,用户输入关键词后,系统可以自动补充相关描述,如光影效果、质感、风格等,推动创作的平权。此外,通过“提示词精准控制”功能,满足更专业的设计要求。
在“智能创作”层面,MiRacleVision通过“深化创作”功能进一步丰富作品细节,提高表现力。通过“AI画面扩展”功能可以让作品尺寸更大、细节更丰富。
助力电商、广告、游戏、动漫、影视五大行业
吴欣鸿表示,AI视觉大模型不仅提升了视觉呈现,也提高了工作流的效率,目前大模型与工作流的结合仍在探索阶段,抓住应用场景的核心需求至关重要。
吴欣鸿提到,MiRacleVision将落地于电商、广告、游戏、动漫、影视五大行业,旨在提升这些行业的工作流效率。

在电商行业,从涂鸦生成线稿、线稿上色、商品图、模特试穿图,到电商物料输出,全程可通过MiRacleVision实现。
在广告行业,MiRacleVision覆盖创意脑暴、创意深化、平面排版、多尺寸展现、线下投放预览等全工作流,助力客户在广告物料制作环节提效。
在游戏行业,MiRacleVision可以涵盖场景设计、角色设计、道具设计、UI图标、宣发物料等流程,同时降低游戏行业的成本。
在动漫行业,MiRacleVision实现了概念设计、故事板生成、线稿上色、动漫补帧等流程,支持创意到成品的快速落地。
在影视行业,MiRacleVision的高可控性可以满足概念场景设计、分镜设计、人物造型、道具设计、宣发物料的效果要求,极大提升影视行业设计环节的效率。
吴欣鸿认为,MiRacleVision将充分发挥奇思妙想和智能创作的能力,在上述五大行业深耕,持续助力更多设计场景。
视觉大模型应用普及将在2026-2030年走向成熟期
在活动现场,吴欣鸿分享了对AI视觉大模型的思考。他表示,AI视觉大模型的本质是无穷无尽的视觉创意库。应用层相当于内容提取器,根据用户需求从这个巨大的创意库中提取所需内容,让用户在特定场景中使用。AI视觉大模型和应用之间相辅相成,大模型为应用提供技术支撑,应用反哺大模型的效果迭代。

吴欣鸿指出,目前AI视觉大模型在生产端面临三个待解决的问题:垂直领域的极致效果、工作流整合、变现能力。随着AI视觉大模型与生产端的磨合,这三个问题将逐步解决。

吴欣鸿认为,视觉大模型应用普及将经历三个阶段:2024年前为探索期,2024-2025年为高速发展期,2026-2030年为成熟期。随着视觉大模型在生产端的应用走向成熟,将助力千万设计场景,引领美学的升级与社会经济增长。
此外,美图公司还公布了6月19日发布的影像生产力工具最新数据:AI视觉创作工具“WHEE”的优质AI效果生成数已超过550万张,打造的设计师生态初见成效;AI口播视频工具“开拍”月活跃用户数已突破35万;桌面端AI视频编辑工具“WinkStudio”已累计服务近10万名视频创作者;主打AI商业设计的“美图设计室”正在助力近百万中小电商卖家降本增效;美图AI助手“RoboNeo”每天帮助近万名用户自动修图,比传统修图效率提升35%;AI数字人生成工具“DreamAvataR”于8月底上线并主打“AI演员”数字人服务。
