作为安谋科技自研异构计算矩阵中的一员,尽管围绕“玲珑”系列构建的多媒体生态系统日趋完善,但面对不同行业客户复杂多变的需求,持续推动产品技术的演进迭代,不断优化产品间的高效协同,并与本土芯片设计企业深化合作,已经成为当务之急。为此,安谋科技于日前最新推出了旗下首款本土自研的图像显示处理器——“玲珑”D8/D6/D2 DPU,以及新一代高效视频处理器——“玲珑”V510/V710 VPU。

在汉语中,“玲珑”一词指物寓意精巧细致,指人寓意灵巧敏捷。作为安谋科技自研异构计算矩阵中的一员,尽管围绕“玲珑”系列构建的多媒体生态系统日趋完善,但面对不同行业客户复杂多变的需求,持续推动产品技术的演进迭代,不断优化产品间的高效协同,并与本土芯片设计企业深化合作,已经成为当务之急。

为此,安谋科技于日前最新推出了旗下首款本土自研的图像显示处理器——“玲珑”D8/D6/D2 DPU(Display Processing Unit),以及新一代高效视频处理器——“玲珑”V510/V710 VPU(Video Processing Unit)。

什么是“玲珑”?

“玲珑”,是安谋科技在继“周易”NPU、“星辰”CPU和“山海”SPU之后,在2020年正式推出的自研多媒体产品线,涵盖了“玲珑”V5/V7 VPU和“玲珑”V6/V8 VPU等多款已量产应用的多媒体处理器,以满足主流市场不断增长的4K/8K实时编解码需求,具有配置灵活可定制、编解码性能优异、面积小等优点。

“目前,多媒体处理器的应用范围基本覆盖了‘端+边+云’等各类场景。”在日前举行的“玲珑”DPU&VPU新品发布媒体沟通会上,安谋科技多媒体处理器研发负责人周华表示,仅以车载应用为例,根据第三方数据,大屏化、多屏化、高清化将带动车载显示市场规模稳固上升,其中HUD和电子后视镜将贡献主要增量市场,预计2025年车载显示市场规模可达1208.3亿元;随着汽车智能化程度的不断提升,车载摄像头数量也将从2022年的5046万颗增长至2025年的超过1亿颗,年复合增长率达到25.7%。

此外,支持多媒体产业发展的政策也频频出台。从2017年开始,几乎每年都会推出相关政策(文件)来鼓励和引导向4K、8K等超高清电视产业的发展。在这样的背景下,多媒体产品无疑会拥有着更长久且更旺盛的生命力。

据悉,“玲珑”VPU系列面世超过三年,目前已授权30多家国内合作伙伴,并应用于手机终端、PC、智能汽车、智能安防等主流场景。此外,2023年推出的Arm智能视觉参考设计也集成了“玲珑”VPU,支持紧凑的、多格式且高效能的视频编解码处理。

据周华介绍,安谋科技作为国内领先的芯片IP设计与服务提供商,一直致力于面向所有细分市场构建兼具标准化和灵活性的产品,并以此将IP价值最大化。通过对主流市场的覆盖,以及与不同客户的深度定制合作,安谋科技能够凭借全面的多媒体解决方案,高性能、灵活、可配置的产品架构,以及完整的系统支持,充分满足国内市场对于多媒体处理器的不同需求。

安谋科技多媒体处理器研发负责人周华

首批支持H.266标准,视频处理迎来新标杆

“玲珑”V510/V710 VPU可被视作上一代“玲珑”V6/V8 VPU的迭代升级版本,其编解码性能均实现了翻倍提升,尤其是在4K/8K应用场景中的编码质量可提高25%以上(8K视频编解码能力高达每秒120帧),能够更好地兼顾主流市场和新兴应用的实时编解码需求。其中,V510系列主要面向4K及以下视频的应用场景,最多可支持4核配置;V710系列则针对高端的8K视频应用场景,最多可支持8核配置。

“玲珑”V510/V710视频处理器概览

本次活动上,安谋科技VPU产品经理董峰特别指出:对最新一代国际视频编码标准H.266的支持,是“玲珑”V510/V710 VPU的最大升级亮点。H.266,也被称为多功能视频编码(Versatile Video Coding,VVC)。相对于之前的H.265/HEVC和H.264/AVC视频编码标准,H.266/VVC对8K超高清、屏幕、高动态和360度全景视频等新的视频类型,以及自适应带宽和分辨率的流媒体和实时通信等应用,提供了更好的支持。在同等画质下,H.266能够比上一代标准节省约50%的流量,高清视频的传输和存储成本得以显著降低。

安谋科技VPU产品经理董峰

据介绍,目前国内头部的互联网内容商已经开始在H.266标准层面上展开相应的部署,包括H.266数据流、从端侧到云端的转码等,主要是在低码率以及带宽变化比较频繁的场景下,通过H.266技术带给用户更好的实际场景感受。

作为国内首批同时支持H.266标准的编码及解码视频处理器IP,“玲珑”V510/V710 VPU采用了多核多格式编解码融合的可编程处理架构,不仅大幅节省了存储空间及带宽成本,还助力合作伙伴基于不同应用场景灵活配置性能与功耗,以确保整体系统的成本、功耗和面积最佳平衡。

例如,V510 VPU将H.264/H.265的编码性能直接提升2倍;与V6 VPU的H.265编码质量相比,其H.266的编码质量实现30%的提升;与X.265的Very Slow档次相比(即当前云端转码、云端直播这类场景使用较广的CPU软编),V510 VPU的H.266编码质量提升了20%。

与DPU的设计初衷类似,VPU是专为处理、优化和传输视频数据而设计的计算单元,可以胜任各种多媒体处理任务,包括但不限于解码、编码、渲染、缩放和后处理。早期VPU主要集中在硬件解码,为DVD播放器和初代流媒体设备提供支持,而现代VPU开始集成AI功能,支持实时内容识别、视频增强和智能编码。

演化至今,VPU本质上是一种“专用于视频处理领域的低功耗AI加速器”,定位在CPU与GPU之间,适用于那些不需要GPU高性能及其相应功耗的持续AI工作负载。毕竟,对于高性能需求,GPU拥有更大量的算术逻辑单元(ALUs),可为神经网络背后的矩阵数学提供相对大量的处理能力;CPU仍然是选择简单、低延迟工作负载的处理器,这些工作负载不能等待VPU初始化,或者工作负载的大小不值得进行专门优化。

据市研机构Bluewave的相关分析显示,2021年全球视频流媒体市场的价值为610亿美元,到2028年将达到2130亿美元,这期间的复合年增长率高达20%。其中,视频直播占据70%的份额,其余30%则是按需服务的市场。这些也从侧面印证了视频处理应用侧乃至视频处理器等上游元器件的广泛前景。

近年来,由于多模态生成式AI技术引领了新一轮的技术革新与产业升级,因此在数据中心和云计算领域,不断增加的大模型训练和推理任务,对高清视频编解码的处理速度和效率也提出了更高要求,需要在保证数据准确性的同时,实现低延迟、高吞吐量的视频处理,这也促使VPU逐渐成为数据中心的重要组成部分,以应对海量视频数据的加速需求。

在终端侧,VPU一方面与我们熟知的智能手机、安防监控、AR/VR、AIoT等智能设备相结合,不断提高设备的视频编解码性能,降低视频处理所需功耗与时延。另一方面,VPU的应用场景也在不断延展、出新,这其中又以汽车行业最具代表性,尤其是在自动驾驶技术涉及的障碍物检测、障碍物跟踪、交通信号灯检测、车道线检测、可驾驶区域分割、特征跟踪、行人行为预测领域,以及智能座舱所包括的驾驶员监测系统(DMS)、车载信息娱乐系统(IVI)、行车记录仪(DVR)等应用。

董峰强调称,转码场景下,考虑到端侧设备的差异化,对于视频流内容,即使是相同的内容,“用什么样的码率和帧率,能够在端侧实现更好的统一体验,这是非常具有挑战的场景”。因此,对具备编解码融合架构的V510/V710 VPU而言,其动态分配能力能够让客户在业务层面上更灵活地,按需进行产品的差异化配置和管理。

数智化浪潮下的图像显示新宠

在数智化浪潮推动下,视频图像已成为人们感知、理解和分享世界的重要载体,图像显示技术的应用边界不断拓宽。特别是随着人工智能、智能座舱、自动驾驶等前沿技术的持续演进,智能终端创新加速,新兴终端应用场景如智能汽车、AI PC、AI手机、智能家居、工业机器等不断涌现,消费者对智能设备的信息交互和娱乐需求也日趋多样化。

更大的屏、更多的屏、更好的显示效果、更多的应用、更安全的内容显示是安谋科技DPU产品经理柴卫华对当前显示市场需求给予的总结。在此基础上,超高清、跨屏联动、多屏异显、数据安全、SoC系统集成支持等,成为了新的技术挑战,这对相关企业在图像显示技术实时处理、画质增强、数据安全等关键能力方面提出了更高要求。

安谋科技DPU产品经理柴卫华

顾名思义,显示处理器DPU是专门用于处理和优化显示图像信号的计算单元。通过接收并处理来自主机的图像信号,DPU在完成图像分辨率的放大或缩小(Scaling)、灰度校正(Gamma Correction)、图像混合及抖动(mage Blending & Dithering)等图像处理功能后,可将其转换为显示器能够正确显示的信号。

资料显示,全新的“玲珑”D8/D6/D2 DPU具备高效出众的实时处理能力,在可灵活按需配置架构的加持下,其单IP性能可高达每秒8K60帧,或者同时支持4个每秒4K60帧的实时显示输出,并且具备低延时、低系统带宽以及高数据安全等特点。“玲珑”D8/D6/D2 DPU在确保系统整体方案的高性能和高画质的前提下,还能有效控制系统的成本、功耗和带宽,同时实现与Arm架构的深度系统协同。

“玲珑”D8/D6/D2显示处理器概览

其中,“玲珑”D8系列主要面向高性能显示的应用场景,可实现每秒8K60帧的实时显示处理,或者单IP核支持4个每秒4K60帧的实时显示输出;D6系列则针对性能能效优化显示的应用场景,可实现每秒8K30帧或者4K120帧的实时显示处理,或者单IP核支持2个每秒4K60帧的实时显示输出;D2系列则用于注重能效比显示的物联网场景,可实现每秒2K60帧的实时显示处理。

丰富的图像处理能力也是“玲珑”D8/D6/D2 DPU的另一亮点。据介绍,该款DPU具备前后级可配置的Gamma和Gamut管理,以及可扩展的协处理接口。深度流水设计支持SDR和HDR内容输入输出,以及主流的影像图形格式。其图像增强模块不但能够有效提升清晰度,还支持1/6到64倍缩放、水平和垂直方向的镜像、90°/180°/270°旋转,以及上述镜像与旋转的任意组合。

同时,为了满足多种智能场景下的高效设计,“玲珑”D8/D6/D2 DPU还支持多达16层的内容输入,独特的Smart Layer技术支持可确保超过16层内容的叠加显示,加之灵活的内容输入管理,可确保输入内容的高效利用。

DPU作为显示技术的核心部件,随着高分辨率与高刷新率、新型显示技术支持、智能化与集成化的不断演进,将有望成为驱动图像显示处理技术在未来五年内不断发展的主要动力。例如,随着消费者对显示质量要求的不断提高,Mini LED、Micro LED、OLED等新型显示技术和高分辨率(4K/8K)、高刷新率(120Hz/144Hz或更高)、HDR高动态范围显示将成为显示设备的标准配置,DPU需要不断升级以满足这些需求,提供更高的亮度、对比度、色彩饱和度和更长的使用寿命,以实现更清晰、流畅的显示效果。 

当然,未来的显示处理器将更加智能化,不但能够自动识别和适应不同的显示需求,提供个性化的显示效果,其集成度也将进一步提高,实现更多功能的集成,降低系统成本,提高可靠性。

持续打造一体化、高质量异构计算平台

自2018年独立运营以来,安谋科技在自研业务领域成绩斐然,不但推出了“周易”NPU、“星辰”CPU、“山海”SPU、“玲珑”VPU和DPU等本土创新处理器产品线,并全部实现了客户相关产品的流片和量产。截止目前,安谋科技自研产品已向超过220家本土客户进行授权,相关客户芯片出货量突破5亿颗,自研业务核心技术专利数量达到150余项,为本土芯片产业的创新发展做出了相当重要的贡献。

安谋科技作为芯片产业链上游的领军企业,持续发挥“技术桥梁”和“创芯引擎”等关键作用,既是其独特的产业定位,也是其核心竞争力所在:一方面,通过引入Arm最新产品技术,紧密连接中国市场与Arm全球生态。以今年落地中国市场的“Arm技术授权订阅”模式为例,凭借其灵活、便捷且极具性价比的产品组合和服务支持,目前该模式已获得授权的国内客户总数达到30家,迅速受到了众多国内芯片企业的青睐与拥护。

另一方面,安谋科技持续深耕本土自研创新,为国内客户提供高效、创新的产品技术支持,助力其研发成果快速商业化,从而不断为智能汽车、AIoT、移动终端、数据中心基础设施等核心产业注入“芯”势能。

近年来,安谋科技自研业务与Arm技术相结合的异构计算平台,正加速助力国产芯片创新成果“遍地开花”。今年7月,此芯科技在其首款AI PC芯片“此芯P1”中异构集成了“周易”NPU等安谋科技自研业务产品,以及Arm CPU、GPU等IP,更好地满足了生成式AI在PC等端侧场景的应用需求;芯擎科技在2023年推出的座舱芯片“龍鷹一号”目前累计出货超过40万片,已应用于包括吉利银河E5、领克08等20余款车型之中,其中正是搭载了“周易”NPU。

“极好的软硬件通用性,可以更好地理解中国本土芯片设计企业的需求,并以此为基础去挖掘寻找价值点,使得我们的产品更具有针对性。”周华在本次新品发布会上的这句话其实很好地概括了众多中国本土企业看好安谋科技和Arm架构的主要原因。

而如果从系统角度来看,安谋科技追求的还不仅仅是一体化、完整的异构计算矩阵,更是一种基于场景的分析方法论。也就是说,通过对游戏、编解码、安全等客户关心的关键场景进行分析和提取,首先分析出CPU、GPU、NPU、VPU&DPU等异构计算单元的工作量,其次再通过对各计算单元工作量的评估,进而得到性能和功耗模型的详细分析,并在此基础上拓宽至带宽、功耗、性能等更多维度指标,最终实现最优化的系统设计,为客户提供多元化的、满足实际场景需求的解决方案。

责编:Lefeng.shao
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
安谋科技原联席CEO刘仁辰和陈恂正式卸任,由瑞芯微前副总经理陈锋接任新任CEO。此次安谋科技任命陈锋为公司唯一全职CEO,他的上任标志着安谋科技进入了一个新的发展阶段......
AI正稳步改变半导体行业,这一趋势在领先EDA公司和硅片代工厂表现得尤为突出。三大EDA工具制造商(Cadence、Synopsys和西门子EDA)已宣布与台积电合作,致力于为先进芯片制造节点开发AI驱动的设计流程。本文将简要回顾这些合作的现状。
由于有助于加速设计开发、缩短上市时间和降低成本,Chiplet正迅速崛起中……
此次收购符合南芯科技的长期战略规划,通过整合昇生微在嵌入式芯片设计上的技术专长和研发团队,南芯科技将强化其在硬件、IP、算法及软件等方面的技术优势……
三星上代 1b nm 内存于 2022 年 10 月完成开发、2023 年 5 月量产,若按新计划,1c DRAM 开发结束时间定于 2025 年中,量产则可能延后到 2025 年底……
“我不是说摩尔定律已死,因为它并没有”,西门子 EDA 首席执行官 Mike Ellow说道。“但有趣的是,我们将从这些大型单片SOC及它们的可制造性转向更具有特殊功能的离散硅片。”
全球人形机器人领域上市公司的百强名单将人形机器人产业链区分为大脑、身体以及集成三大核心环节,覆盖全球共计100家上市公司。中国共37家企业上榜(中国大陆32家,台湾5家),其中深圳7家,占中国大陆上榜企业近四分之一,包括比亚迪、腾讯、优必选、速腾聚创、雷赛智能、兆威机电、汇川技术等......
DeepSeek模型虽降低AI训练成本,但AI模型的低成本化可望扩大应用场景,进而增加全球数据中心建置量。光收发模块作为数据中心互连的关键组件,将受惠于高速数据传输的需求。未来AI服务器之间的数据传输,都需要大量的高速光收发模块......
凭借新一代3nm制程工艺与全新架构,骁龙® 8至尊版的单核和GPU 性能提升均超过 40%,使得Find N5在性能上实现质的飞跃……
简化物联网连接:应用就绪型软件构建模块
2月10日,市场调查机构 IDC 发文称,2024 年全年中国平板电脑市场出货量为 2985 万台,同比增长 4.3%,市场迎来回暖。报道称, 2024 年第 4 季度市场出货量为 786 万台,受库
据业内人士2月11日透露,三星显示器近期限时推出名为“平衡假期”的特别假期。具体内容是,每周平均工作超过52小时的员工可获得三天带薪休假,每周工作超过60小时的员工可获得六天带薪休假。上个月,三星显示
点击蓝字 关注我们SUBSCRIBE to USImage: GM消息人士向“GM Authority”透露,雪佛兰Blazer的内燃机版本据说即将停产,最终将仅以电动汽车(EV)的形式投放(http
点击蓝字 关注我们SUBSCRIBE to USImage: TASA总部位于东京的初创公司ArkEdge Space声称,其拍摄的可能是小型立方星(CubeSat)所拍摄的质量最高的地球照片(htt
据IT业界9日报道,苹果公司最近进入了“可折叠iPhone”零部件供应商选择的最后阶段,据观察,三星显示器已决定独家供应初期面板量。据悉,三星将供应约1500万至2000万片,并将于明年5月开始量产,
2月10日盘后,光峰科技发布公告,于近日收到某知名车企出具的开发定点通知书,将为其旗下新时代科技品牌的SUV车型供应智能座舱显示产品,预计2025年内量产供货。光峰科技认为,随着消费者对智能座舱需求的
我是芯片超人花姐,入行20年,有40W+芯片行业粉丝。有很多不方便公开发公众号的,关于芯片买卖、关于资源链接等,我会分享在朋友圈。扫码加我本人微信👇1.  信越化学(Shin-Etsu Chemica
周一,埃隆·马斯克与一群投资者提出以974亿美元收购ChatGPT开发商OpenAI,这一金额远低于这家人工智能公司最近1570亿美元的估值。OpenAI首席执行官萨姆·奥特曼在X平台上发文,立即拒绝
恩智浦 NXP 荷兰当地时间昨日宣布已同边缘 NPU 企业 Kinara 达成最终协议,计划以 3.07 亿美元现金收购后者。这笔交易预计将于 2025 上半年完成,但须满足包括监管部门批准在内的惯例
  电子无尘车间在设计时需要重视多个问题,以确保生产环境的洁净度、生产效率和安全性。以下是需要重视的设计问题,具体随合洁科技电子洁净工程公司一起来了解下吧! &emsp