据思科统计,互联网视频流在网络带宽中占据重要比例,预计到2022年将占消费互联网流量的82%以上。视频服务已成为现代生活不可或缺的一部分。
为了减少网络波动引起的播放卡顿问题,自适应多码率技术被认为是有效的解决方案之一,如MPEG-DASH、Apple的HLS和快手的LAS等。自适应比特率(ABR)算法的核心在于根据网络状态和播放情况动态调整视频清晰度(码率),以实现流畅度、清晰度和稳定性的平衡,从而提升用户体验。
ABR算法主要分为两类:一类是基于启发式策略,通过建立模型或规则来选择码率,但这类算法往往需要精心调整参数以适应多变的网络环境。另一类是利用机器学习方法,使播放器通过与现实网络互动,自主学习适合当前网络条件的ABR算法。
尽管任何算法在实际应用前都需要经过长时间的调试和优化,特别是在解决实验室中看似不重要但在实际部署中至关重要的问题时。
鉴于此,快手音视频技术部联合清华大学孙立峰教授团队,对基于学习的ABR算法进行了研究和改进,并在国际顶级会议IEEE INFOCOM 2020和期刊IEEE JSAC上发表了相关成果。
1. 自适应多码率
自适应多码率传输架构分为基于分片(如MPEG-DASH、HLS)和基于流式(如快手的LAS)两种类型。本文以基于分片为例,视频发布前会先切片和转码,生成不同码率和清晰度的片段。客户端在下载完当前片段后,ABR算法会根据带宽、缓冲状态和用户信息等综合考虑,选择下一个片段的码率,从而实现自适应传输,提升用户体验(QoE)。
QoE通常由视频码率、卡顿时间等因素构成。对ABR算法而言,这种优化是长期的,旨在平衡用户体验和网络条件。
2. 基于学习的ABR算法
机器学习是否能够解决这个问题?答案是肯定的。例如,Pensieve(SIGCOMM'17)将码率自适应过程建模为一个马尔可夫决策过程,并使用深度强化学习算法训练,最终在QoE目标上超过了过去最优算法18%。然而,尽管Pensieve在性能上取得了重大突破,但由于种种限制,其实现难度较大。
1、结合领域知识,降低成本
针对成本问题,我们提出了一种“结合领域知识”的概念。具体而言,我们尝试将BBA算法和基于学习的方法结合起来,通过深度学习增强BBA算法,同时BBA算法也为学习算法提供了更多领域知识,从而降低成本。
我们设计了一个名为Stick的系统,结合了传统缓冲区方法和基于学习的方法。该系统主要由两个部分组成:基本Stick模块和Trigger模块。Stick模块使用深度强化学习算法训练神经网络,根据输入的形状输出一个单值,代表允许下载的最大码率的缓冲值。随后采用BBA方案,将该值扩展为一个缓冲表,决定每个缓冲下的码率。实验表明,利用领域知识可以显著降低神经网络的规模,最高可减少88%的模型大小。
Trigger模块用于决定何时启用Stick模块,进一步降低了整体成本。实验显示,Trigger可以减少Stick的综合成本,节省幅度在39%-61%之间。此外,Trigger还能提升一些经典算法的性能。
2、提高训练效率,在线终身学习
针对训练效率问题,我们提出了Lifelong-Comyco,一种终身模拟学习的ABR算法。该系统由内外两层循环组成。内循环系统利用模拟学习方法快速有效地从专家序列中学习策略;外循环系统则赋予系统持续更新的能力,采用终身学习的方式自主“查缺补漏”。
实验结果表明,Lifelong-Comyco系统大幅提高了训练效率,整体训练步数减少了1700倍,训练时长减少了16倍。在HSDPA数据集上,模拟学习训练出的策略比传统方法高出7.5%-17.99%的QoE。
3. 结语
基于机器学习的ABR算法在实际应用中仍有许多挑战,包括可解释性、鲁棒性和模型大小等。快手拥有完善的数据集和优秀的算法团队,诚邀各界人士共同探讨和合作,推动落地有效的算法,提升用户体验。
招聘
职位:科技编辑/记者 工作地点:北京、深圳 职责: 1. 关注学术热点事件,及时跟踪报道; 2. 采访人工智能领域的学者或研发人员; 3. 参加各种人工智能学术会议,并进行会议内容报道。
要求: 1. 热爱人工智能学术研究,善于与学者或企业工程人员交流; 2. 具备理工科背景,对人工智能技术有一定了解者优先; 3. 英语能力强(工作内容涉及大量英文材料); 4. 学习能力强,对人工智能前沿技术有了解,并能逐步形成自己的见解。
有兴趣者请将简历发送至邮箱:jiangbaoshang@yanxishe.com。