NVIDIAAI技术助力腾讯云音视频PaaS平台构建高性能、高质量的云直播及媒体处理服务

英伟达NVIDIA中国 2022-08-31 22:30

腾讯云音视频 PaaS 平台与 NVIDIA 团队合作,利用 NVIDIA TensorRT 加速视频直播和点播业务中视频增强 AI 模型的推理效率;借助 NVIDIA Maxine Video Effects SDK 的 AI 绿幕功能实现高性能高精度的人像分割,提升云导播台服务的用户体验。

腾讯云音视频 PaaS 平台专注技术产品,构建了行业中极速高清智能转码、超低时延快直播的音视频解决方案,连续四年居于市场份额和解决方案首位[1],覆盖国内 90% 音视频客户。团队通过不断的技术创新和产品优化引领行业发展,其中,腾讯云-媒体处理融合视频 AI 技术持续突破核心编解码技术,2021/2022 MSU 世界云端视频转码比赛综合最佳,且在最新的 SLC 评测中,也取得多项最佳的成绩,另外腾讯云-媒体处理服务支撑全网 40%+ 实时媒体处理量[2]。"低延时、低码率、高画质",腾讯云音视频为全真互联时代,提供坚实的数字化助力。


在构建高品质高性能的音视频解决方案的过程中,往往会面临许多挑战。


首先,由于网络传输或采集设备不佳的原因,直播或点播的画质可能出现不清晰的问题,此时需要应用视频增强算法,如视频超分辨率。为了不影响用户的观看体验,视频增强算法需要以足够低的延时运行。此外,音视频 PaaS 平台还需要对视频进行高效的视频标签识别、视频分类、视频剪辑等,这都必须藉由 AI 模型的推理速度,达到最佳程度的优化和加速。


另外,在直播场景中,用户希望对主播直播的画面应用虚拟背景,这要求将人像从直播画面中精准地分割出,并应用预设的背景。如何获得实时性高、准确性强的人像分割也是一个难点。


腾讯云音视频 PaaS 平台与 NVIDIA 在诸多产品和业务中开展了深入合作,共同打造高性能的音视频解决方案。


在云直播 CSS 服务以及媒体处理 MPS 服务中,腾讯云推出视频增强功能。为了加速视频增强模型的推理速度,腾讯云使用了 NVIDIA TensorRT 对模型进行高性能优化。TensorRT 是构建在 NVIDIA 的并行编程模型 CUDA 基础之上的,结合最新一代 NVIDIA Ampere 架构 GPU,TensorRT 还可以利用 Tensor Core 实现稀疏性加速的特点。对于深度学习推理应用的生产环境部署方面,TensorRT 提供了 INT8 和 FP16 的优化,低精度推理能够极大的降低应用的延迟,有益于实现实时视频增强服务。


图 1 基于 GPU 的多媒体处理工作管线示意图

©2022 腾讯云

此图片由腾讯云制作,如果您有任何疑问或需要使用此图片,请联系腾讯云


在云直播 CSS 云导播台业务的 AI 智能人像抠图功能中,腾讯云采用了 NVIDIA Maxine Video Effects SDK 中提供的 AI Green Screen(简称 AIGS)功能,对直播画面进行实时而准确的人像分割。Maxine AIGS 对视频流抠图的精度和稳定性做了专门的优化,并且加入了 CUDA Graph 优化技术,及时在 GPU 负载高的时候也能降低整体的延时,使得云导播台的人像分割模块能实现多路并发、远超实时的处理高效率。Maxine AIGS 提供了简单易用的 API 接口,腾讯云音视频 PaaS 平台可直接在 FFmpeg filter 中通过 API 调用该功能,并可与其他多媒体处理 filter 联动对视频流进行处理。


最后,在媒体处理 MPS 业务中的视频 AI 功能,涉及到了多个深度学习模型的推理,腾讯云同样采用 NVIDIA T4 GPU 进行高性能推理。这得益于几乎所有主流的深度学习框架均能在 NVIDIA GPU 上执行高效计算。


NVIDIA TensorRT 在腾讯云音视频 PaaS 平台的提供的视频增强和视频 AI 功能中,使得推理阶段的应用在 NVIDIA T4 GPU 上可以实现同比单一 CPU 平台高达 40 倍的加速效果。TensorRT 可以从所有主流的深度学习框架中导入训练好的模型并进行优化,同时提供相应的 API 和解析器,生成经过优化的运行时引擎可以部署到画质增强服务中。


未来,腾讯云音视频 PaaS 平台与 NVIDIA 将持续合作,进一步提升音视频产品和服务中 AI 算法的性能。双方将基于 NVIDIA TensorRT 最新的特性,利用低精度和稀疏化模型压缩技术,对云直播和云点播业务中涉及到的视频增强与视频 AI 功能模型的推理进行大幅加速。此外,NVIDIA Maxine 在视频特效和音频特效方面持续发布新特性,包括音频超分技术、立体环绕声增强技术等,也将助力腾讯云音视频 PaaS 平台提供更丰富的音视频服务和功能。双方在未来也将不断探索打造编解码、AI、图形渲染全流程 GPU 加速的视频处理方案。


[1] 资料来源于腾讯云音讯频开发者社区官网,其数据来源于国际数据公司(IDC)发布的《中国视频云市场跟踪(2021上半年) 》

https://cloud.tencent.com/developer/article/2046119。


[2] 资料来源于腾讯云音讯频开发者社区官网,据莫斯科国立大学(MoscowState University)于2021年与2022年举办的MSU云端视频转码大赛(CloudVideo Transcoding Services Comparison)成绩公布

https://cloud.tencent.com/developer/article/1794385; https://cloud.tencent.com/developer/article/2057612



点击 “阅读原文” 或扫描下方海报二维码,即可免费注册 GTC 大会,切莫错过在 2022 年 9 月 19 日至 22 日的 GTC 大会上与 AI 开发者和创新者交流的机会。


评论 (0)
  • 后摄像头是长这个样子,如下图。5孔(D-,D+,5V,12V,GND),说的是连接线的个数,如下图。4LED,+12V驱动4颗LED灯珠,给摄像头补光用的,如下图。打开后盖,发现里面有透明白胶(防水)和白色硬胶(固定),用合适的工具,清理其中的胶状物。BOT层,AN3860,Panasonic Semiconductor (松下电器)制造的,Cylinder Motor Driver IC for Video Camera,如下图。TOP层,感光芯片和广角聚焦镜头组合,如下图。感光芯片,看着是玻
    liweicheng 2025-05-07 23:55 159浏览
  • 某国产固态电解的2次和3次谐波失真相当好,值得一试。(仅供参考)现在国产固态电解的性能跟上来了,值得一试。当然不是随便搞低端的那种。电容器对音质的影响_电子基础-面包板社区  https://mbb.eet-china.com/forum/topic/150182_1_1.html (右键复制链接打开)电容器对音质的影响相当大。电容器在音频系统中的角色不可忽视,它们能够调整系统增益、提供合适的偏置、抑制电源噪声并隔离直流成分。然而,在便携式设备中,由于空间、成本的限
    bruce小肥羊 2025-05-04 18:14 248浏览
  • 二位半 5线数码管的驱动方法这个2位半的7段数码管只用5个管脚驱动。如果用常规的7段+共阳/阴则需要用10个管脚。如果把每个段看成独立的灯。5个管脚来点亮,任选其中一个作为COM端时,另外4条线可以单独各控制一个灯。所以实际上最多能驱动5*4 = 20个段。但是这里会有一个小问题。如果想点亮B1,可以让第3条线(P3)置高,P4 置低,其它阳极连P3的灯对应阴极P2 P1都应置高,此时会发现C1也会点亮。实际操作时,可以把COM端线P3设置为PP输出,其它线为OD输出。就可以单独控制了。实际的驱
    southcreek 2025-05-07 15:06 270浏览
  • 2024年初,OpenAI公布的Sora AI视频生成模型,震撼了国产大模型行业。随后国产厂商集体发力视频大模型,快手发布视频生成大模型可灵,字节跳动发布豆包视频生成模型,正式打响了国内AI视频生成领域第一枪。众多企业匆忙入局,只为在这片新兴市场中抢占先机,却往往忽视了技术成熟度与应用规范的打磨。以社交平台上泛滥的 AI 伪造视频为例,全红婵家人被恶意仿冒博流量卖货,明星们也纷纷中招,刘晓庆、张馨予等均曾反馈有人在视频号上通过AI生成视频假冒她。这些伪造视频不仅严重侵犯他人权
    用户1742991715177 2025-05-05 23:08 101浏览
  • UNISOC Miracle Gaming奇迹手游引擎亮点:• 高帧稳帧:支持《王者荣耀》等主流手游90帧高画质模式,连续丢帧率最高降低85%;• 丝滑操控:游戏冷启动速度提升50%,《和平精英》开镜开枪操作延迟降低80%;• 极速网络:专属游戏网络引擎,使《王者荣耀》平均延迟降低80%;• 智感语音:与腾讯GVoice联合,弱网环境仍能保持清晰通话;• 超高画质:游戏画质增强、超级HDR画质、游戏超分技术,优化游戏视效。全球手游市场规模日益壮大,游戏玩家对极致体验的追求愈发苛刻。紫光展锐全新U
    紫光展锐 2025-05-07 17:07 225浏览
  • 飞凌嵌入式作为龙芯合作伙伴,隆重推出FET-2K0300i-S全国产自主可控工业级核心板!FET-2K0300i-S核心板基于龙芯2K0300i工业级处理器开发设计,集成1个64位LA264处理器,主频1GHz,提供高效的计算能力;支持硬件ECC;2K0300i还具备丰富的连接接口USB、SDIO、UART、SPI、CAN-FD、Ethernet、ADC等一应俱全,龙芯2K0300i支持四路CAN-FD接口,具备良好的可靠性、实时性和灵活性,可满足用户多路CAN需求。除性价比超高的国产处理器外,
    飞凌嵌入式 2025-05-07 11:54 24浏览
  • 这款无线入耳式蓝牙耳机是长这个样子的,如下图。侧面特写,如下图。充电接口来个特写,用的是卡座卡在PCB板子上的,上下夹紧PCB的正负极,如下图。撬开耳机喇叭盖子,如下图。精致的喇叭(HY),如下图。喇叭是由电学产生声学的,具体结构如下图。电池包(AFS 451012  21 12),用黄色耐高温胶带进行包裹(安规需求),加强隔离绝缘的,如下图。451012是电池包的型号,聚合物锂电池+3.7V 35mAh,详细如下图。电路板是怎么拿出来的呢,剪断喇叭和电池包的连接线,底部抽出PCB板子
    liweicheng 2025-05-06 22:58 402浏览
  • ‌一、高斯计的正确选择‌1、‌明确测量需求‌‌磁场类型‌:区分直流或交流磁场,选择对应仪器(如交流高斯计需支持交变磁场测量)。‌量程范围‌:根据被测磁场强度选择覆盖范围,例如地球磁场(0.3–0.5 G)或工业磁体(数百至数千高斯)。‌精度与分辨率‌:高精度场景(如科研)需选择误差低于1%的仪器,分辨率需匹配微小磁场变化检测需求。2、‌仪器类型选择‌‌手持式‌:便携性强,适合现场快速检测;‌台式‌:精度更高,适用于实验室或工业环境。‌探头类型‌:‌横向/轴向探头‌:根据磁场方向选择,轴向探头适合
    锦正茂科技 2025-05-06 11:36 409浏览
  • 随着智能驾驶时代到来,汽车正转变为移动计算平台。车载AI技术对存储器提出新挑战:既要高性能,又需低功耗和车规级可靠性。贞光科技代理的紫光国芯车规级LPDDR4存储器,以其卓越性能成为国产芯片产业链中的关键一环,为智能汽车提供坚实的"记忆力"支持。作为官方授权代理商,贞光科技通过专业技术团队和完善供应链,让这款国产存储器更好地服务国内汽车厂商。本文将探讨车载AI算力需求现状及贞光科技如何通过紫光国芯LPDDR4产品满足市场需求。 车载AI算力需求激增的背景与挑战智能驾驶推动算力需求爆发式
    贞光科技 2025-05-07 16:54 160浏览
  • 文/Leon编辑/cc孙聪颖‍《中国家族企业传承研究报告》显示,超四成“企二代” 明确表达接班意愿,展现出对家族企业延续发展的主动担当。中国研究数据服务平台(CNRDS)提供的精准数据进一步佐证:截至 2022 年,已有至少 280 家上市家族企业完成权杖交接,其中八成新任掌门人为创始人之子,凸显家族企业代际传承中 “子承父业” 的主流模式。然而,对于“企二代” 而言,接棒掌舵绝非易事。在瞬息万变的商业环境中,他们既要在白热化的市场竞争中开拓创新、引领企业突破发展瓶颈,又需应对来自父辈管理层的经
    华尔街科技眼 2025-05-06 18:17 6浏览
  • Matter协议是一个由Amazon Alexa、Apple HomeKit、Google Home和Samsung SmartThings等全球科技巨头与CSA联盟共同制定的开放性标准,它就像一份“共生契约”,能让原本相互独立的家居生态在应用层上握手共存,同时它并非另起炉灶,而是以IP(互联网协议)为基础框架,将不同通信协议下的家居设备统一到同一套“语义规则”之下。作为应用层上的互通标准,Matter协议正在重新定义智能家居行业的运行逻辑,它不仅能向下屏蔽家居设备制造商的生态和系统,让设备、平
    华普微HOPERF 2025-05-08 11:40 125浏览
  • 5小时自学修好BIOS卡住问题  更换硬盘故障现象:f2、f12均失效,只有ESC和开关机键可用。错误页面:经过AI的故障截图询问,确定是机体内灰尘太多,和硬盘损坏造成,开机卡在BIOS。经过亲手拆螺丝和壳体、排线,跟换了新的2.5寸硬盘,故障排除。理论依据:以下是针对“5小时自学修好BIOS卡住问题+更换硬盘”的综合性解决方案,结合硬件操作和BIOS设置调整,分步骤说明:一、判断BIOS卡住的原因1. 初步排查     拔掉多余硬件:断开所有外接设备(如
    丙丁先生 2025-05-04 09:14 119浏览
  • 在过去的很长一段时间里,外卖市场呈现出美团和饿了么双寡头垄断的局面。美团凭借先发优势、强大的地推团队以及精细化的运营策略,在市场份额上长期占据领先地位。数据显示,截至2024年上半年,美团外卖以68.2%的市场份额领跑外卖行业,成为当之无愧的行业老大。其业务广泛覆盖,从一线城市的繁华商圈到二三线城市的大街小巷,几乎无处不在,为无数消费者提供便捷的外卖服务。饿了么作为阿里本地生活服务的重要一环,依托阿里强大的资金和技术支持,也在市场中站稳脚跟,以25.4%的份额位居第二。尽管市场份额上与美团有一定
    用户1742991715177 2025-05-06 19:43 17浏览
  • 多功能电锅长什么样子,主视图如下图所示。侧视图如下图所示。型号JZ-18A,额定功率600W,额定电压220V,产自潮州市潮安区彩塘镇精致电子配件厂,铭牌如下图所示。有两颗螺丝固定底盖,找到合适的工具,拆开底盖如下图所示。可见和大部分市场的加热锅一样的工作原理,手绘原理图,根据原理图进一步理解和分析。F1为保险,250V/10A,185℃,CPGXLD 250V10A TF185℃ RY 是一款温度保险丝,额定电压是250V,额定电流是10A,动作温度是185℃。CPGXLD是温度保险丝电器元件
    liweicheng 2025-05-05 18:36 309浏览
  • 文/郭楚妤编辑/cc孙聪颖‍相较于一众措辞谨慎、毫无掌舵者个人风格的上市公司财报,利亚德的财报显得尤为另类。利亚德光电集团成立于1995年,是一家以LED显示、液晶显示产品设计、生产、销售及服务为主业的高新技术企业。自2016年年报起,无论业绩优劣,董事长李军每年都会在财报末尾附上一首七言打油诗,抒发其对公司当年业绩的感悟。从“三年翻番顺大势”“智能显示我第一”“披荆斩棘幸从容”等词句中,不难窥见李军的雄心壮志。2012年,利亚德(300296.SZ)在深交所创业板上市。成立以来,该公司在细分领
    华尔街科技眼 2025-05-07 19:25 220浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦