如今很多人已经用惯了5G,网络运营商已经在计划5G Advanced,3GPP标准的第18版。这一新版本所支持的功能包括扩展现实、厘米级定位和室内室外微秒级计时,将引发无线接入网(RAN)计算需求的爆炸式增长。关于这一点,考虑一下消费者和企业固定无线接入的情况便可理解。
在这些地方,远程无线单元(RRU)通过大规模MIMO进行波束成形,必须能够管理繁重但可变的流量,而用户设备(UE)必须支持载波聚合。两者都需要更多的信道容量。因此,解决方案必须具备高性能和低延迟、更加环保、更高效地管理可变负载,并且更经济高效地支持大规模部署。
图1:5G网络正朝着几个方向发展,所有都指向网络开放性和复杂性。资料来源:ABI Research
其结果,5G基础设施设备制造商期望芯片在功率、性能和单位成本优势等所有方面都很优异,还有所有与这些相关的附加功能。从虚拟化RAN(vRAN)组件开始,这些组件能够在一个计算平台上同时运行多条链路,从而有望提高效率。
虚拟RAN和矢量处理
vRAN组件旨在实现集中式RAN的十年目标:
包括规模经济、供应商的更大灵活性以及通过软件对多链路、大容量业务流进行集中管理。我们知道如何在大型通用CPU上进行虚拟化作业,因此满足这一需求的解决方案似乎是不言自明的。不过,这些平台价格昂贵、功耗大,而且作为无线设计核心时,信号处理效率低下。
另一方面,具有大型矢量处理器的嵌入式DSP,虽然专为波束成形等信号处理任务的速度和低功耗而优化,但过去并不支持多任务间的动态工作负载共享。如果要增加更多的容量,就需要增加更多的内核,有时甚至是大型内核集群,此时最好是通过预定的内核分区来进行静态共享。
瓶颈是矢量处理,因为矢量DSP的大部分资源被矢量计算单元(VCU)所占用。如何尽可能高效地利用这种资源,对于虚拟RAN容量的最大化至关重要。通过加倍内核数量来处理两个通道的默认方法中,要求每个通道有一个单独的VCU。但在任何时候,一个通道中的软件可能需要执行矢量运算,而此时另一个通道可能正在执行标量运算,故在这些周期中有一个VCU将会处于闲置状态。
现在想象一下具有两个矢量运算和寄存器文件的双通道使用一个VCU的情况。基于信道需求,仲裁器动态决定如何最好地利用这些资源。如果两个通道在同一个周期内都需要矢量运算,这些运算将被定向到适当的矢量ALU和寄存器文件。如果只有一个通道需要矢量运算,则计算可以跨两个矢量单元进行,从而使计算加速。
动态矢量线程
这种管理两个独立任务之间的矢量操作方法,看起来非常像执行线程,可最大限度地利用固定计算资源来处理一个或多个同时进行的任务。动态矢量线程(DVT)技术将每个周期的矢量操作分配给一个或两个算术单元(在本例中)执行。
图2:DVT最大限度地利用固定计算资源来处理一个或多个同时任务。资料来源:CEVA
可以想象把这个概念扩展到更多的线程,甚至进一步优化可变通道负载的VCU利用率,因为独立线程中的矢量操作通常是不同步的。
支持DVT需要对传统的矢量处理进行一些扩展。操作必须由宽矢量算术单元来执行,支持每个周期128个或更多的MAC操作。VCU还必须为每个线程提供一个矢量寄存器文件,以便为每个线程单独存储矢量寄存器环境。矢量仲裁单元通过多线程之间的有效竞争,来提供调度矢量操作。
这种能力如何支持虚拟化RAN?在绝对峰值负载下,这种平台上的信号处理需求将继续得到令人满意的满足,就像在双核DSP上一样,每个平台都有单独的VCU。当一个通道需要矢量运算,而另一个通道处于静止状态或被标量处理占用时,第一个通道通过利用全部矢量容量,来更快地完成矢量周期,从而相对于两个DSP内核时,能以更小的占位面积提供更高的平均吞吐量。
虚拟化RAN中带DVT的DSP
DVT如何支持更高效基带处理的另一个例子,可以通过5G-Advanced RRU来理解。这些RRU设备必须支持大规模MIMO波束成形处理。基于大规模MIMO的RRU预计将支持多达128个活动天线单元,包括支持多用户和多载波。这意味着在这些无线电设备上有大量的计算需求,这在DVT下变得更加高效。在UE(支持固定无线接入的终端和CPE)中,载波聚合也受益于DVT。因此,DVT对蜂窝网络、基础设施和用户终端都有好处。
对于这些虚拟化需求而言,利用大型通用处理器来解决可能仍然很诱人,但在信号处理路径中,这可能是一种倒退。我们不能忘记,基础设施设备制造商转向采用嵌入式DSP的ASIC是有充分理由的。对于具备竞争性的固定无线接入解决方案而言,就需要探索ASIC(基于DSP)的优势,以支持动态矢量线程。
(参考原文:Dynamic vector threading for vRAN, massive MIMO in 5G)
本文为《电子工程专辑》2023年4月刊杂志文章,版权所有,禁止转载。点击申请免费杂志订阅