在2023年华为云数字文娱AI创新峰会上,华为云全球市场与销售服务总裁石冀琳宣布,华为云将推出盘古数字人大模型,帮助用户在12小时内完成数字人的生成。她进一步表示,借助人工智能技术,每个人都有机会实现数字人自由。
根据华为云开发者联盟的介绍,盘古数字人通用大模型是通过华为云MetaStudio数字内容生产线构建的。该数字人模型基于华为云的盘古基础大模型能力、渲染引擎以及实时音视频技术,并通过PB级的音视频数据进行训练。
盘古数字人大模型涵盖数字人形象、动作、表情、口型和声音等多种元素。官方表示,用户可以利用个人数据对数字人进行训练,从而创建个性化的大模型。生成数字人后,用户可以通过文本、语音或视频等方式输入驱动向量信息,以生成高清数字人视频。
据悉,用户只需输入文字(如文本或ProMpt文本),便可在约10秒内生成数字人模型;上传照片则可以在30秒左右生成不同类型的数字人模型。
此外,用户还可以通过拍摄5分钟的视频,经过一小时的训练生成数字人。官方表示,这种方式生成的数字人将保留用户的个性化形象、表情、动作、声音及口型信息。完成数字人生成后,用户可以通过对话进行二次编辑和背景融合,例如发型、配饰和服装等。
IT之家此前报道,盘古大模型3.0在2023年7月7日的华为开发者大会上正式发布,能够在矿山、铁路、气象、金融、代码开发和数字内容生成等多个领域发挥作用。
[[[IMG_1]]]
[[[IMG_2]]]
[[[IMG_3]]]
