首页 > 行业解读 > 你的WebRTC应用该使用哪种音视频编解码器

你的WebRTC应用该使用哪种音视频编解码器

12 5 月, 2021

我们很难抉择应该给WebRTC应用选哪一款音视频编解码器。VP8？H.264? VP9？还是使用AV1？HEVC呢？

有关WebRTC视频编解码器的温馨提示

曾几何时WebRTC世界很简单，只有VP8、Opus和~~G.711~~。G.711被划掉是因为我不推荐使用它。真的没有理由这样做。后来，H.264作为必须实现的视频编解码器加入。WebRTC进展顺利。

之后，谷歌决定在Chrome中引入VP9，将其作为备选编解码器。Mozilla也在Firefox中加入了VP9。微软呢？他们从Edge切换到Chromium就能“免费”使用它了。苹果的话，VP9应该会出现在他们的Safari 开发预览版中，这么做主要是因为谷歌Standia使用了VP9。这听起来可能有点奇怪。

另外，苹果公司决定把HEVC作为自己的可选编解码器添加到WebRTC中。可能是为了进一步迷惑我们。

最后是AV1。就目前而言下一代最好的视频编解码器。一旦它被添加到Chrome中（即90版本），并且被开发者使用，大家就会发现这一点了。

WebRTC浏览器支持的各类视频编解码器

上图显示了目前web浏览器中对于视频编解码器的支持状况。

总结如下：

VP8和H.264在浏览器中很常见，但它们都存在一些问题；
VP9开源多年，仍没有被广泛采用。它可能“很快”出现在Safari中；
HEVC是苹果公司的产品；
AV1上市比较迟。

你的WebRTC应用该选择VP8还是H.264

如今，你可能正在使用，或者应该使用VP8或H.264。

这两者之间有什么真正的差别吗？不，并没有。在给定的比特率下，它们产出的音视频质量都差不多。

但VP8和H.264之间还是有一些细微差别的。比如：

谷歌并没有真正在WebRTC中使用H.264。所以其实这两者中还是VP8应用更广。比如之前H.264一直不支持在Chrome中联播（现在支持了）；
VP8几乎没有硬件加速，所以它在某些情况下会占用更多的CPU；
H.264在苹果设备、PC、安卓上有硬件加速。但有时你在WebRTC中不会有H.264的实现，因为无法获得硬件，软件实现也不存在（由于版权费等问题）。
Temporal scalability仅在VP8中可用，H.264中不可用。

我们自己进行的快速测试表明，H.264解码器比VP8解码器性能更好，无论H.264上是否有硬件加速。这个问题值得我们深入讨论。

那么你应该使用哪一个呢？

WebRTC中该使用VP8、H.264还是VP9

真正要使用的话，首先要考虑一个问题——要选择VP9吗？去年我确实推荐使用VP9。但也没看到什么变化——反正我是没看到有人真正采用VP9。

除了谷歌，没有人在用VP9。

在我们的测试中，它的CPU占用率接近于VP8。这很令人惊讶，也可能是谷歌在谷歌会议中使用它的原因。

VP9最棒的一点是什么呢？那就是它还支持SVC。

那么现存问题是什么呢？那就是苹果公司还没有接受VP9格式。以后应该会接受的的，问题是什么时候接受罢了。

什么时候在WebRTC中应该使用HEVC？

这个问题的答案很简单——永远不要使用它。

换句话说，如果只在苹果设备之间进行通话，那么HEVC可能是一个不错的选择。

现在AV1是否能派上用场呢？

并不确定。

根据我们自己的测试，AV1在性能方面比所有其他编解码器要差很多。它编解码所占用的CPU是其他音视频编解码器所需的两倍或更多。

AV1的质量本应比其他编解码器更好的，这样你才可能真的愿意负担它额外占用的CPU。据我所知，如今使用AV1不外乎两个原因：

1. 处理特殊情况，如特低比特率，此时CPU不是问题，带宽才是；

2. 只进行解码，而编码器在云端，在此处你能控制硬件时。但你要支付其计算成本；

3. 据传闻，AV1擅长解码缩略图。

欢迎来到多编解码器的WebRTC世界

WebRTC初创时选择不多，只有VP8和H.264。这就是全部了。而现在？市面上有4-5种视频编解码器可供选择。

我们中的大多数人最终都选择使用VP8。也有些人选择H.264，主要是因为性能方面的考虑。其余的编解码器常被谈论，但几乎从未使用。

面世较晚的视频编解码器看来确实前景无量，比如VP9、AV1甚至HEVC在WebRTC应用中都潜力无限。但它们仍有一些难题亟待解决，主要是CPU和浏览器间的可用性问题。

为了使用这些编解码器，我们需要一种新的方法。即一个应用程序可以使用不止一个视频编解码器，有时甚至在同一会话中也这样做的方法。

以下是几个建议供大家探讨：

只在1对1通话中支持较高复杂度的编解码器。当通话超过两个参与者时，就动态切换到其他视频编解码器；
在低比特率情况下，动态切换到更复杂的编解码器；
在设备上启用尽可能多的编解码器并行解码，然后根据编码器的CPU能力决定其应该发送的内容；
在联播中使用多种视频编解码器。例如使用比特率很低的AV1，然后在它旁边使用比特率更高的VP8或VP9。联播不支持这一点（目前），但你可以用不同的编解码器和比特率打开两个独立的端对端连接，以达到类似的效果。

这样做是否值得？也许吧。我觉得在应用中提高视频质量还是很重要的。推进WebRTC多视频编解码器领域，8分的努力才能收获 2 分的优化。如果你完成了所有其他较为简单的优化，可以试试这个领域。

更头疼的是，谷歌和微软正在研发Lyra和Satin，全新的AI驱动音视频编解码器。事情将变得更加有趣（和复杂）。

文章地址：https://bloggeek.me/webrtc-video-codec/

你的WebRTC应用该使用哪种音视频编解码器

填写常用邮箱，接收社区更新

近期热门

论cPaaS，UCaaS和WebRTC

RNNoise：用深度学习进行噪声抑制（基础知识）

跟macOS系统上的WebRTC音频bug说再见

WebRTC数据通道的5个用处

在安卓设备上测试WebRTC

媒体捕捉API给微软Edge浏览器带来了屏幕捕捉功能

为什么开发WebRTC与web开发不一样？（上）

准备好靠WebRTC赚钱了吗？

WebKit详细分析苹果的WebRTC

WebRTC vs Zoom，哪一个具有更好的视频质量？

填写常用邮箱，接收社区更新