7月26日消息,随着硬件的不断进步和网络基础设施的完善,互联网用户对流畅的使用体验和更出色的视觉效果的需求随之上升,尤其是在 FHD 和 4K 高清画质方面。各大长视频平台如爱优腾,以及短视频平台如 B站、抖音和快手,均已支持 HDR、2K、4K 甚至 8K 的超清视频内容,实时互动也正式迈入高清时代。
今天,实时互动云服务提供商声网在北京举行了“实时高清·超级画质”发布会。这套方案旨在提升实时视频场景中的画质和用户体验。

1. 在画质提升方面,声网通过多维度的画质增强和视频增强算法组合,极大地改善视觉效果,支持移动端1080P和PC端4K的超高清画质。通过暗光增强、色彩提升和视频降噪等多个维度,提供显微镜级的细节捕捉,AI 感知处理算法更能理解用户对美的需求。同时,端侧实时超分功能使画质提升跨越多个级别。
2. 关于美颜效果,声网 RTC 搭载了符合实际场景的自然审美美颜最佳实践,能够实现复杂场景的精细调优,确保明暗和动态变化都有全方位的覆盖。该功能兼顾不同人种的面部特征,适应海外市场需求;高精准度的五官贴合和稳定的点位追踪,确保无抖动、无延时。此外,场景化美颜 API 显著降低了开发门槛,从300多行代码缩减至10行,使得快速上线成为可能,开发时间从7天缩短至3小时。
3. 实现流畅的进出和频道切换,声网的实时高清·超级画质采用了 Multi-Path 多链路传输机制,确保观众在不同场景下都能获得顺畅的体验。国内视频卡顿率低至1.1%,海外也仅为2%;1v1视频通话的平均连通时间小于500毫秒,直播场景的首帧出图时间低至100毫秒,秒开率高达97%。通过声网 SDK 的应用,因视频卡顿导致的线上不可用问题比例减少了70%。
4. 在低码高清方面,声网的实时高清·超级画质提供了行业领先的码率编码传输方案,最高可降低70%的码率,最低可实现500K的码率以达到720p的流畅体验。
5. 玩法的升级也带来了更多可能,声网免费提供了秀场秒转1v1直播、团战PK等热门直播玩法。此外,在实时合唱场景中,能够实现1/1000秒级的同步误差控制。
6. 声网还免费提供 PC 开播能力支持,推出了适配多种单反摄像头的 PC 开播套件,确保网络环境更加稳定,支持 2K/4K 60FPS 的超高清桌面屏幕实时共享,完美兼容弹幕游戏等新型直播间玩法。
7. 数据监控和业务收益追踪方面,声网的实时高清·超级画质能够实现全链路质量监控,实时追踪观众侧的质量问题,提供高清画质数据指标的价值分析,以及业务收益的实时跟踪。
8. 声网提供一站式技术支持,覆盖集成前中后期的所有问题,确保用户在集成和使用过程中无忧。同时,声网的技术和服务符合全球安全合规法律法规要求,使开发者和企业不必担心数据合规问题。
声网 CTO 兼首席科学家钟声在分享中提到,实时高清的呈现首先依赖于视觉感知的前处理,包括暗光和噪声改善、AI 视觉感知处理,接着通过多格式视频编码和弱网对抗,以实现视频的自适应分发,最后进行基于视觉感知的后处理。
声网研发总监秦泽雄则详细介绍了声网实时高清技术的实现。声网的 AI 推理引擎是实现实时高清的核心。在前处理阶段,基于深度学习的 AI 感知处理可带来30%的视频压缩效率提升;在编码阶段,实时高清·超级画质采用 H.265 高效编码器,改善码流、编码质量、延时及算法复杂度之间的关系,使得在有限带宽下能够传输更高质量的网络视频,相同码率下H.265的画质明显优于H.264。在传输阶段,声网使用自适应弹性传输算法,适应不同的网络环境,确保接收者根据下行带宽自动接受对应级别的内容。在后处理阶段,声网基于深度学习技术进行修复以增强高清画质,智能调整画质的锐度和对比度,从而提升用户的主观体验。同时,声网在 AI 算法的低消耗方面也进行了优化,使得低端设备的算法能够自动降级,各模块间实现统一调度,避免冗余资源的浪费。
