高通在AI开放日上宣布全新的Cloud AI 100芯片将瞄准云端AI推理市场。高通这次能否借助5G优势,将其移动端的AI性能延伸到云端,开辟出新的领地呢?

最近在深圳举行的高通AI开放日上,高通宣布一个全新的Cloud AI 100产品,但没有透露太多细节,因为要到下半年才能出样,量产要等到2020年。《电子工程专辑》分析师通过现场采访、市场分析人士访谈及外媒信息,逐渐梳理出高通开发Cloud AI 100背后的逻辑,揭开其神秘的面纱。

瞄准云端AI推理

据市场调研公司预测,数据中心AI加速器市场规模将从2018年的25亿美元增长到2023年的212亿美元。我们知道在云计算平台的AI加速包括训练和推理两部分,其中AI训练侧重算力和性能,而AI推理更看重能效比,即每瓦性能。

AI芯片的用量来看,AI推理加速器使用场景更广泛,需求量自然更大。根据市调机构Tractica的预测数据,单单数据中心AI推理这一细分市场从2018年到2025年将有10倍的增长,达到170亿美元。在目前的数据中心处理器玩家中,英特尔垄断着服务器CPUAI推理,而英伟达霸占着AI训练,AMD和赛灵思正在联合进攻这一令人垂诞的市场。此外,还有众多AI芯片初创公司想进来分一杯羹,比如Wave Computing, Graphcore和基于RISC-V架构的Esperanto

全球Superscale云平台服务商是AI加速器的主要需求者,其中谷歌会使用自家开发的TPU,而亚马逊也在大力宣传自己的Inferentia机器学习推理芯片。看来潜在的大客户只有Facebook、微软、阿里云、腾讯云和百度了。曾经尝试进军服务器CPU市场而失败的高通欲涉足云端AI推理领域,能成功吗?

5G移动是高通的独家王牌

高通产品管理副总裁Ziad Asghar在介绍Cloud AI 100时,列出了高通在四个方面的优势,包括采用先进的7nm工艺、规模化、信号处理技术,以及低功耗设计专长。高通和英伟达的高端芯片都是交给台积电代工的,这方面高通并没有特别的优势。在规模化方面,高通的手机芯片出货量以亿计,规模和成本优势可以部分转移到新的产品上,但刚开始应该不会很明显。

CLOUD-AI-100-1.png

在移动终端的信号处理方面,高通确实有独到之处。内置AI引擎的骁龙855 SoC是高通目前最高端的移动处理器了,而Asghar宣称Cloud AI 100的性能是855芯片的50倍,即其峰值AI性能将达到350 TOPS。这个AI引擎就是高通所谓的神经处理单元(NPU),集成了"Hexagon" DSP"Adreno" GPU,在移动终端上与其"Kryo" CPU配合,可以高速执行密集的浮点和整数运算。

CLOUD-AI-100-2.jpg

终端的AI性能如何在云端同样发挥其优势呢?高通有两张王牌可以打,即5G和低功耗设计。在移动应用处理器方面,高通的骁龙芯片并不比苹果、三星和华为的自研芯片强多少,但在5G基带上就无人能及了。最近苹果别无选择,只好跟高通达成和解,继续使用高通的5G芯片,不然5G iPhone都不知道什么时候能够出来。现在高通脚踏iOSAndroid两只船,在即将到来的5G时代必将独立船头,一路领先。具有高速度和低延迟特性的5G必将成为嫁接移动终端和云端的桥梁,成为高通将AI性能带到云端的驱动器。

英特尔和英伟达都曾尝试进入智能手机和平板电脑的移动市场,但都以失败告终。究其原因,主要就在于他们的CPU/GPU功耗太大,这是电池供电的移动终端无法忍受的。好在他们两家都在数据中心市场找到了用武之地,但现在注重环保节能和节约成本的数据中心也开始以能效比为主要衡量指标了。高通在低功耗设计方面的专长在云端又可以充分发挥了,特别是用量比较大的云端边缘服务器,因为它起着连接移动终端和云平台的桥接作用。

Asghar在演讲中宣称Cloud AI 100的能效将比目前市面上AI推理芯片强10倍,并多次强调它将作为协处理器(co-processor)以插卡形式“即插即用”到云端服务器上。小尺寸和低功耗的AI推理加速器插卡将会得到云平台服务商的青睐。

CLOUD-AI-100-3.jpg

此外,Cloud AI 100不需要单独的操作系统和软件支持,因此可以最大限度地支持现有的主流深度学习框架,包括CaffeKerasmxnetTensorFlow PaddlePaddleCognitive Toolkit等。广泛的平台和软件支持可以吸引更多的软件和应用开发商,从而构建自己的生态圈。

应用为王

高通总裁Cristiano Amon在一次视频访谈中谈到Cloud AI 100的应用前景,预言到云端就是新的游戏平台,这是Cloud AI 100的“完美应用场景”。在云端服务器上执行的高能效AI推理可以减轻移动终端的AI处理负荷,移动游戏要求低延迟,因此AI操作要从数据中心的大型服务器中走出来,尽量接近移动终端。

CLOUD-AI-100-4.jpg

谷歌最近公布的云游戏平台Stadia似乎也验证了这一预言。在深圳AI开放日上,高通邀请Vivo、王者荣耀开发团队和腾讯AI Lab负责人助阵,一起演绎了一场专业游戏电竞赛。由此可以看出移动游戏将是最能发挥Cloud AI 100极致性能的应用,而腾讯云也可能成为国内首批Cloud AI 100用户。

高通的多元化尝试

为应对增长逐渐放缓的手机市场,以及来自联发科和紫光展锐的蚕食竞争,高通早就开始进行多元化尝试,以分散业务过于依赖手机的风险,同时也在寻求新的增长点。欲借收购NXP进入汽车电子市场的计划破灭后,以Arm服务器芯片进军服务器市场的雄心壮志也未能实现。过去几年又遭受多个政府的反垄断调查,再加上官司缠身,高通似乎迷失了方向。

CLOUD-AI-100-5.jpg

Amon承认在服务器CPU市场跟英特尔展开正面交战,付出的代价太大,而收效甚微。于是果断裁掉Centriq服务器业务部门,虽然裁员对公司员工会造成负面影响,而且高通与贵州省的合作项目华芯通也遭受到关闭的命运,但从公司战略角度来看是正确的决定。

这次瞄准云端AI推理这一细分市场的尝试能否成功呢?笔者认为,高通这次比较务实,从自身核心优势出发,以全新的产品切入一个有很大增长潜力的新兴市场,成功的概率还是比较大的,只要高通在策略执行上不出大错,能够沉下心来坚持几年的话。云端AI加速市场还没有出现明显的技术领先者,无论是高性能CPU,还是GPUFPGA,还是特定域的ASIC,都有机会占据一席之地。也许这次高通真的能够将其在移动端的优势延伸到云端,借助AI5G这两个高速运转的飞轮,开辟出一个新的领地来。

 

相关阅读利用本性、借力培育打造令人惊叹的AI SoC

  

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
半导体行业正迎来一个新的建设高峰期,SEMI预测,2025年,全球范围内将有18个新的晶圆厂项目开始建设,其中15座为12英寸晶圆厂,3座为8英寸晶圆厂,大部分预计将于 2026 年至 2027 年开始运营......
尽管Imagination在RISC-V领域取得了一定的成就,但公司似乎认为继续投入资源于RISC-V处理器核心的开发并不符合其长期战略目标。Imagination决定终止其基于RISC-V指令集架构的GPGPU内核的研发工作,并将重心转向其擅长的GPU和AI领域......
这款机器人头上的摄像头可以录制视频或使用人工智能识别物体,虽然该机器人的动作仅限于挥动细小的手臂和眨动动画眼睛,但它可以与一把小型电动椅子配对,自动在家中导航。
Ken Glueck认为,美国2800亿美元的芯片法案所取得的成就,将被出口管制框架夺走,“因为在一项IFR中,它成功地将美国公司的全球芯片市场缩小了80%,并将其交给了中国。”
IP供应商、芯片设计服务提供商和AI专家在以AI为中心的设计价值链中的地位正变得更加突出。本文给出了四个设计用例,强调了服务于AI应用的芯片设计模型的重新调整。
英特尔临时联席CEO Michelle Johnston还表示,“英特尔会在2025年及以后继续增强AI PC产品组合,向客户提供领先的英特尔18A产品样品,并在2025年下半年量产”。
• 目前,iPhone在翻新市场中是最热门的商品,并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展,其平均销售价格(ASP)现已超过新手机。 • 新兴市场是增长的最大驱动力,消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年,这些翻新机平均销售价格将首次超过新手机。
从全球厂商竞争来看,三季度凭借多个新品发布,石头科技市场份额提升至16.4%,连续两季度排名全球第一……
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准,配套USB网关,可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成
其中包含Wi-Fi 7和蓝牙5.4 模组FME170Q-865、Wi-Fi 6和蓝牙5.4 模组FCS962N-LP、Wi-Fi 6和蓝牙5.3模组FCU865R 、独立Wi-Fi和蓝牙模组FGM840R、高功率Wi-Fi HaLow模组FGH100M-H……
来源:《中国半导体大硅片年度报告2024》2016 年至 2023 年间,全球半导体硅片(不含 SOI)销售额从 72.09 亿美元上升至121.29 亿美元,年均复合增长率达 7.72%。2016
据报道,由于多种芯片需求疲软,日本芯片制造商瑞萨电子今年将裁员数百人。瑞萨电子已通知员工,计划在日本和海外的 21000 个岗位中裁员不到 5%。该公司还将推迟原定于春季实施的定期加薪。瑞萨电子的一位
1月7日,据韩媒 sisajournal-e 消息,三星计划 2025 年下半年推出三折叠手机,采用 G 形双内折设计,完全展开后尺寸为 12.4 英寸。据称,有别于华为的 S 形折叠屏方式(In&O
01周价格表02周价格观察硅料环节本周硅料价格:N型复投料主流成交价格为40元/KG,N型致密料的主流成交价格为38元/KG;N型颗粒硅主流成交价格为35元/KG。供给动态头部料企继续推进减产策略,月
点击蓝字 关注我们SUBSCRIBE to USImage: The Verge据悉,OpenAI已经制定了成为一家营利性公司的计划。在近日发布的一篇博客文章中,OpenAI的董事会表示,将把公司现有
亚化咨询重磅推出《中国半导体材料、晶圆厂、封测项目及设备中标、进口数据全家桶》。本数据库月度更新,以EXCEL表格的形式每月发送到客户指定邮箱。中国大陆半导体大硅片项目表(月度更新)中国大陆再生晶圆项
近日,闻泰科技在一场电话会议中阐述了其出售ODM(原始设计制造)业务的战略考量。           闻泰科技表示,基于地缘政治环境变化,考虑到 ODM 业务稳健发展和员工未来发展利益最大化,公司对战
  在千级电子净化车间中设置通风系统时,需要综合考虑多个因素,包括洁净度要求、换气次数、气流组织、空气处理、温湿度控制以及节能与环保等。以下是合洁科技电子洁净工程公司的一些具体的设
戴尔科技AI PC产品组合助力终端用户释放创造力并提高工作效率。 戴尔科技统一旗下产品组合品牌命名,旨在帮助用户更轻松、快速地找到相匹配的PC、配件及服务。 搭载英
1月8日消息,据外媒报道,由于半导体行业需求衰退,日本瑞萨电子将在日本及海外裁员数百人,并且定期加薪也将被推迟!据报道,瑞萨电子在日本和海外有约21,000名员工,本次裁员比例近5%。这一裁员计划已于