互联网资讯 / 人工智能 · 2024年3月9日

字节跳动在AI时代的追赶与布局

Sora爆火与剪映的跟进

近日,Sora的爆红再次将全球科技巨头在AI领域的竞争推向聚光灯下。除了全球知名的短视频平台,字节跳动在海外市场的核心工具CaPCut(剪映海外版)也在加速推进AI生成功能的公测。多方消息显示,剪映在数月前便组建了封闭研发团队,秘密开展AI产品的研究,而字节跳动在AI大模型、多模态数字人、AI生成视频等领域也有多项布局。

自去年底以来,字节跳动在人员与部门结构上进行了若干调整,展现出向AI转型的决心。去年11月成立AI业务团队“Flow”;今年2月,抖音集团CEO张楠离任,表示未来工作重心将转向剪映CaPCut,以为AI领域创造更多想象空间。

随着AI技术快速迭代及多类大模型的逐步成熟,传统内容生产体系和平台模式正经历变革。相较于其他全球一线厂商,字节此前在AI领域的动作一直较为低调。

2024年被业内视为AI产品的爆发元年,字节跳动能否在AI时代与全球竞争对手并肩,关系到其在未来生态中的定位。

Sora的冲击与字节的应对

除了在全球范围内具备影响力的短视频平台,字节在海外市场的另一张明星牌是CaPCut。两者同属字节跳动产品生态链,用户可通过TikTok账号登录CaPCut,并将作品上传分享至TikTok及其他社交平台,形成闭环的用户留存与收益。

2023年4月,CaPCut引入AI模板与特效,下载量与收入随之上升,成为2023年上半年全球最具盈利能力的视频剪辑应用之一。全球数据表明,截至2023年8月,CaPCut在苹果与安卓平台的全球用户达到4.9亿;此外,2023年CaPCut的应用内购收入首次突破亿美元。

Sora的出现被视为视频生成领域的里程碑,对CaPCut等视频制作工具形成潜在冲击。次日相关市场反应显示,若干国际科技巨头的股价出现波动,反映出市场对文生视频技术快速进展的关注。

在OpenAI正式发布Sora之前,字节跳动已推出过BoxiMaTor与MagicVideo-V2等早期文生视频模型,但与Sora相比存在明显差距。

字节方面对外回应称,BoxiMaTor属于对运动控制对象的技术探索,尚难以落地成完整产品,在画质、保真度与时长等方面仍与国际领先模型存在差距。尽管如此,“中国版Sora”成为行业热议的焦点,剪映仍被视为具有强大竞争力的一环。

内部层面,字节正在加强对剪映与AI领域结合的投入。2月,抖音集团CEO张楠正式转向剪映,传言其将带队在AI辅助创作方面寻求突破,并在朋友圈表达了对与剪映伙伴共同成长的期待。

字节的AI布局与追赶节奏

与百度、阿里等对手相比,字节在AI方面的起步与推进速度曾被认为稍显迟缓。2023年春季,百度、阿里先后推出各自的大语言模型,字节直到2023年8月才正式推出云雀大模型。CEO梁汝波在年度全员会上亦承认,字节在AI领域的进展相对缓慢,直到2023年才开始认真考虑GPT类技术。

有业内人士指出,去年一年间,创始人张一鸣将大量时间投入AI研究,但字节系统性布局AI的动作却在短时间内完成。去年11月的系列调整,一方面收缩了“朝夕光年”游戏部门,另一方面组建Flow并任命技术与业务负责人,推动对AI业务的投入与孵化。

此前,字节尝试将AI功能融入各自产品以提升用户体验与平台黏性,例如2022年抖音的AI绘画功能,以及2023年飞书推出的“飞书智能伙伴”等AI产品,均体现出字节在AI应用层面的探索。

Flow的成立标志着字节在AI领域的布局进入更系统的阶段。据称,Flow成立时从飞书、抖音等若干业务线抽调大量人才,计划孵化多款AI相关创新产品。

去年下半年至今,字节已推出多模态大模型BuboGPT、抖音云雀大模型、文生图开放模型SDXL-Lightning,并上线多款基于AI的产品,如豆包、CICi、BagelBell、即创、Coze/扣子等,覆盖对话、内容创作、数据分析与电商应用等场景。

行业格局与未来趋势

AI驱动的技术革命正在加速,字节跳动需要在自身增长放缓的压力下,快速跟上时代步伐,避免在AI时代被边缘化。全球竞争环境中,Meta、谷歌、Snap等巨头,以及国内腾讯、阿里、百度、华为等厂商,均在加码AI与大模型布局,形成一张庞大且密集的竞争网。

在内容产业,AI生成的内容正带来创作方式与成本结构的根本性变化。对行业而言,AI的成熟将改变从创意到生产的多环节,进而影响创作者收入、工作流程和平台生态。

业内观察也指出,当前AI的能力尚未达到完全替代人类内容生产的程度,更多是提高效率、扩展创作边界。技术人员与创作者的协同在未来将更加重要,字节在这方面的投入与策略将直接影响其生态的竞争力。

[[[IMG_1]]]