视频直播带宽的最强计算过程

鲜枣课堂 2020-04-26 00:00


今天我们来做一道算术题——

做一次视频直播,到底需要多大的网络带宽。


废话不多说,我们直接开始。

我们先从最基本的图像开始计算。

图像,大家都知道,是由很多“带有颜色的点”组成的。这个点,就是“像素点(Pixel)”。

像素是图像显示的基本单位。我们通常说一幅图片的大小,分辨率是1920×1080,就是长度为1920个像素点,宽度为1080个像素点。乘积是2,073,600,也就是说,这个图片是两百万像素的。

对视频来说,常见的分辨率有:

注意:不同的标准,对2K/4K/8K的定义不同



那么,一个像素点是多少比特(bit)呢?

在计算机里,是用数字来表示颜色的。 这就牵 出了 “彩色分量数字化” 的概念

以前我们美术课学过,任何颜色,都可以通过红色(Red)绿色(Green)蓝色(Blue)按照一定比例调制出来。这三种颜色,被称为“三原色”


在计算机里,R、G、B也被称为“基色分量”。它们的取值,分别从0到255,一共256个等级(256是2的8次方)。

所以,任何颜色,都可以用R、G、B三个值的组合表示。

RGB=[183,67,21]

通过这种方式,一共能表达多少种颜色呢?256×256×256=16,777,216种,因此也简称为1600万色。RGB三色,每色有8bit,这种方式表达出来的颜色,也被称为24位色(占用24bit

这个颜色范围已经超过了人眼可见的全部色彩,所以又叫真彩色。再高的话,对于我们人眼来说,已经没有意义了,完全识别不出来。

我们按现在比较流行的1080p直播来举例计算吧,像素点是2,073,600。用24位色,也就是每张图片2,073,600×24bit=49,766,400bit,约5.9MB。

感觉有点大呀~ 别急,我们继续往下看。

接下来看帧率(Frame Rate)

我们的视频,其实就是很多张静止的图像连续播放。


在视频中,一个帧(Frame)就是指一幅静止的画面。帧率,就是指视频每秒钟包括的画面数量(FPS,Frame per second)。  

帧率越高,视频就越逼真、越流畅。

常见的帧率,有24fps(电影标准)、30fps、60fps。

我们就以24fps来算吧,接上前面的结果,那就是:

49,766,400bit×24=‭1,194,393,600‬bit=‭149,299,200‬byte
8bit 比特=1byte 字节

也就是说,每秒视频大小约是142MB,每分钟是8.3GB,每小时是499.2GB。每部90分钟的电影,是748.8GB。

这不科学啊,我们平时看的电影,哪有这么大的?不就才几GB嘛?

没错,我们平时的视频确实没有那么大,因为我们对视频进行了编码压缩。

我们先来看看,视频从录制到播放的整个过程,如下:


首先是视频采集。通常我们会使用摄像机、摄像头进行视频采集。限于篇幅,我就不打算和大家解释CCD成像原理了。


采集了视频数据之后,就要进行模数转换,将模拟信号变成数字信号。其实现在很多都是摄像机(摄像头)直接输出数字信号。

信号输出之后,还要进行预处理,将RGB信号变成YUV信号。

前面我们介绍了RGB信号,那什么是YUV信号呢?

简单来说,YUV就是另外一种颜色数字化表示方式。

视频通信系统之所以要采用YUV,而不是RGB,主要是因为RGB信号不利于压缩

在YUV这种方式里面,加入了亮度这一概念。

在最近十年中,视频工程师发现,眼睛对于亮和暗的分辨要比对颜色的分辨更精细一些,也就是说,人眼对色度的敏感程度要低于对亮度的敏感程度

所以,工程师认为,在我们的视频存储中,没有必要存储全部颜色信号。我们可以把更多带宽留给黑—白信号(被称作“亮度”),将稍少的带宽留给彩色信号(被称作“色度”)。于是,就有了YUV。

YUV里面的“Y”,就是亮度(Luma),“U”和“V”则是色度(Chroma)。

YUV码流的存储格式其实与其采样的方式密切相关。 (采样,就是捕捉数据。

主流的采样方式有三种,YUV4:4:4,YUV4:2:2,YUV4:2:0。


具体解释起来有点繁琐,大家只需记住,通常用的是YUV4:2:0的采样方式,能获得1/2的压缩率。

这些预处理做完之后,就是正式的编码了。

编码的过程和原理我们就不解释了。目前比较流行的编码格式有H.264,H.265。

这些编码格式有着非常惊人的压缩率。 以2013年推出的H.265为例,压缩率能够达到300~500:1(包括前面的视频输入信号YUV重采样)。

也就是说,刚才那个1080p的视频,我们要直播的话,如果采用H.265编码格式(按300:1算),码流就是:

1,194,393,600‬bit ÷ 300 = 3,981,312 bit/s

码流(Data rate)是视频文件在单位时间内使用的数据流量,我们可以理解为视频文件大小除以视频时长。一般来说,码流越大,视频的压缩比就越小,画面质量就越好。


是不是这样就算完啦?当然没有,我们还有音频没有计算呢。


音频的计算相对来说要简单一点。

声音是连续的模拟信号,我们对声音进行采样、量化、编码,最终变成数字信号,然后在网络中传输。


采样的指标是 采样率 也就是单位时间内(每秒)用多少个数据来描述声音波形。

采样率越高,波形越接近,音质越好。

采样率 通常有24KHz、44.1KHz、48KHz等。

常见的数字音频采样率

现在视频直播基本上都是用44.1KHz或48KHz采样率。

然后是采样位数,也称为位深、精度、比特。

这个值有点像前面所说的图像位色。它可以理解数字音频设备处理声音的解析度,即对声音的辨析度。这个数值越大,解析度就越高录制和回放的声音就越真实(声音越细腻)。

声音的采样位数有8bit,16bit,24bit等。

一个bit数据大约可以记录6dB的声音,故定义0dB为峰值。常见的16bit(CD音质),可以记录大概96分贝的动态范围。24bit的声音动态范围-144dB(24×6)—0dB。

人耳的无痛苦极限声压是90分贝,所以,一般来说数字音频基本上都会采用16bit的采样位数。


声音通常会分为单声道或多声道(双声道、四声道等,两个以上的声道就属于立体声)。双声道的话,就是×2。

所以,在无损无压缩格式(例如wav格式)中,音频的码率=采样率(48k)× 位深度(16)× 通道数(2)= 1,536 kbps。

注意,如果是有损压缩(例如mp3格式),音频的码率不等于这个格式,因为原始信息已经被破坏了。

Mp3通过抽取音频中的一些频段来达到提高压缩比,降低码率,减少所占空间,但同时声音的细节如人声的情感、后期的混响等等都已经发生变形。盲听的话也很难较快地分辨出wav和mp3,需要借助设备。


Mp3目前是最为普及的声频压缩格式,可以最大程度地保留压缩前的音质。Mp3常见码率是128kbps、192kbps、224kbps、256kbps。320kbps是mp3格式的最高码率。


我们一般都是用有损压缩格式,192kbps已经够用了,我们以192kbps为例吧。


视频加音频,就是 3,981,312 bps192 kbps = 4,080 kbps。


一般来说,考虑到一些抖动和冗余,网络需求带宽≈视频码率×1.3。所以,带宽需求大约是 5,304 kbps。也就是说,差不多6Mbps的带宽,就可以满足了。



好啦,整个计算过程,大家有没有看明白?这些都是音视频的基础知识,值得好好研究一下哦!


最后,感谢大家的支持!我们下期再见!


—— The End ——



鲜枣课堂 学通信,学5G,就上鲜枣课堂!
评论
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 113浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 65浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 167浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 141浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 61浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 103浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 77浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 38浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 125浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 82浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦