那些曾经颠覆商业、改变文化的企业巨鲸,如亚马逊、谷歌、微软、Facebook、阿里巴巴、腾讯和百度,正在开始重塑半导体产业。他们到底做了什么史无前例的改变?他们为什么要这样做?由此产生的后果是什么?

全球七大数据中心(又称Hyperscalers,超大规模企业)创造了的庞大芯片市场,推动半导体行业达到了新的性能高度和成本底线。一些人担心巨头们分散了芯片厂商的注意力,使他们不再关注更小、更多样化的用户的需求。

更令人担忧的是,大多数Hyperscalers都建立了自己的世界级设计团队,宣称要成为半导体行业的角逐者。他们已经在设计领先的AI加速器和智能网络控制器,而且刚刚开始发布开源RTL,并声称这将是一个不断增长的趋势。

与这些巨鲸竞争是艰难的,但完全丢掉这些巨鲸的订单更加可怕。这极有可能发生,因为欧洲和美国的监管机构现在已瞄准了少数几个顶级Hyperscalers,威胁要瓦解它们。

然而最有可能的情况是,亚马逊、谷歌、微软、Facebook、阿里巴巴、腾讯和百度作为芯片客户同时也是设计厂商将继续成长。半导体行业开始慢慢学会如何与这些巨鲸共游。

据思科公司的数据显示,2016年Hyperscalers运营了338个数据中心;到2021年,这个数量将达到628个,占据全球所有数据中心流量的一半以上。据说最大的Hyperscalers安装的服务器至少达到300万台,甚至可能超过800万台。

根据国际数据公司(IDC)的数据,通过新的销售渠道,Hyperscalers在2018年直接购买了(主要来自英特尔和AMD)全球35%的服务器处理器,高于2013年的15%。“例如,选择x86处理器已使他们成为业界王者,”IDC研究副总裁Shane Rau说。



Hyperscalers为服务器处理器创建了一个宽广的新航道。(来源:IDC)

IHS Markit的首席分析师Vlad Galabov表示,总体而言,Hyperscalers管理着所有公共云服务约70%的业务,他们购买了大约三分之一的全球数据中心设备。他提到,亚马逊、谷歌和微软是英特尔最新Xeon可扩展芯片的首批客户。

这些芯片提供上一代英特尔主存储器两倍的容量。因此,Dell'Oro集团的分析师Baron Fung认为,Hyperscalers在过去两年内购买量大增的情况下几乎垄断了DRAM市场,导致了内存芯片价格的历史性飙升。

Baron Fung提到,去年,包括苹果、IBM和甲骨文在内的十大Hyperscalers花费了近1000亿美元用于购买数据中心设备,比2017年增加了约45%。650 Group创始人Alan Weckel表示,包括苹果公司在内的前八大Hyperscalers去年购买了所有云计算设备的71%,总价值达到1090亿美元,而亚马逊独占其中的12%。

“亚马逊的服务器安装基数大于整个电信行业,”同时关注这两大市场的Weckel表示。相比之下,中国的三家Hyperscalers合起来仍小于亚马逊,而最小规模的百度大约只占亚马逊的十分之一。

20190926-201.jpg
部分人认为苹果、IBM和甲骨文也属于Hyperscalers。 (来源:Dell'Oro)

支出看起来很庞大,但收入也很可观。去年仅亚马逊、谷歌和Facebook三家的收入就超过4000亿美元。

定义铜和光纤网路线图

由于Hyperscalers的数据中心需要高速连接数万台服务器,他们的需求推动了太网控制器、交换机和光模块产品的采购,以及网络标准的建立。早在2010年,Facebook工程师就要求其供应商开始研究Terabit以太网标准,即便在今天这种标准也还是不实际的。

微软Azure云服务网络硬件工程经理Brad Booth表示,“十年前,网络巨头是Cisco和Juniper ,他们站在世界之巅。” “现在,每个客户都会先找到我们和其他Hyperscalers。”在保持云服务领先地位的竞争中,“我们需要不断评估新技术并在适当的时候介入。”

这就是为什么在2015年,Booth帮助创立了板载光学联盟(COBO)。COBO定义了一种方法,可将ASIC和光学组件压缩到构建数据中心网络主干的架顶交换机中。这种光学模块降低了交换机功耗与成本,使之轻松过渡到当今网络最前沿的400-Gbits/s交换机。

微软目前正在评估它的第一个COBO模块,希望于2021年部署它们。但首先,它必须在一个“灰度集群”( canary cluster,也译作金丝雀集群)中对它们进行测试,该集群使用神经网络应用来驱动高水平的测试流量。

20190926-202.png
Hyperscalers定义了一种将ASIC和光学组件结合在一起的方法。 (来源:COBO)

追求更高速率的竞赛仍在持续进行中。今年早些时候,微软和Facebook宣布了一项合作,为交换机的下一个重要发展步骤定义组件——将ASIC和光学组件放在同一个封装内。

“巨鲸们推动了巨大的销量......但只有少数几家Hyperscalers可以证明在芯片上进行功能设置和投资是合理的。”博通(Broadcom)的产品经理Pete Del Vecchio说道,该公司是网络交换芯片的长期霸主。

Linley Group网络分析师Bob Wheeler提到,近年来,少数几家拥有创新交换机芯片的初创公司对Broadcom提出了挑战,但“到目前为止,没有一个真正能对Broadcom的市场份额造成重大影响”。

Wheeler解释说,Hyperscalers的“数量惊人地快速增长”。“十年前,当运营商主导市场时,他们通常每季度购买10,000个交换机端口,但现在Hyperscalers每季度需要100,000个端口。规模和速度是前所未有的,这对初创公司来说的确是一个挑战。”

然而,巨鲸们消减销售的速度也很快。“当我们从10G切换到40G产品时就停止购买10G产品 ,没有拖泥带水,”Booth表示,而即将演进到400G交换机可能又会让今天尖端的100G产品没有多少市场空间。

Hyperscalers还推进了构成网络端点的服务器以太网控制器的发展。早在2014年,Booth和其他人就一起创建了一个专门小组,定义了25G和50G规范,以使当时的10G控制器得到更快地发展。而这些在一定程度上破坏IEEE流程的东西恰恰为电信运营商定义了部分40G和100G标准。

如今,微软已经将其服务器升级到50G以太网链路,其规范几年前就已不存在。而且微软已经计划在几年内转向100G控制器。

有些人认为Hyperscalers劫持了以太网标准流程,其推动的需求可能无法满足传统业务交换机和服务器。而且,Hyperscalers更想要快速达到下一个最高速率,这远远超过了他们对互用性的需求,因为他们只专注于少数供应商。

20190926-203.jpg
Hyperscalers也是网络和存储领域极具影响力的买家。(来源:650 Group)

“他们绝对推动了这个行业,”一位不愿透露姓名的资深以太网标准负责人表示。“获得项目批准的最简单方法就是说有Hyperscaler需要它。

“这种形势的缺点是Hyperscalers不愿意花太多时间去深度开发一个以太网标准。他们引领转向下一个互连标准的速度比其他公司要快……但是,并非每个人都是大猩猩,大猩猩和小公司需求之间的差距越来越大。”

当大客户成为小竞争对手时

为进一步提升网络性能,亚马逊则采用了不同的策略,他收购了初创公司Annapurna,从而得到其用于处理网络协议的智能控制器。IHS Markit的Galabov说,“亚马逊在英特尔或其他公司那里没有找到满意的以太网器件,所以购买了拥有基于Arm核心芯片的以色列公司Annapurna。现在,亚马逊已经成为排名前五的以太网适配器供应商”,仅次于英特尔、Mellanox、Broadcom和Marvell。

Annapurna被亚马逊收购时估计有200名工程师,这个数字今天应该已翻了一倍。“四大网卡供应商的地位一直都没有变过,亚马逊迅速成为第五大以太网适配器供应商,”Galabov说,估计亚马逊内部设计现在已占全球以太网控制器端口和收益的8%。

为了与Hyperscalers建立更深厚的联系,Nvidia也出价69亿美元意欲收购网络专家Mellanox,这是其迄今为止最努力的一次收购。Dell’Oro的Fung表示,Mellanox三分之一的销售额都来自大中型云服务供应商,其产品已成功应用于阿里巴巴、百度、Facebook和腾讯等公司。

Gabalov说,我们期待更快的转变。当计算工作负载发生变化时,Hyperscalers是最先感受到的,为了与对手竞争,他们需要迅速做出反应。而这正是随着深度学习的兴起而带来的,2012年,新型人工智能应运而生。

跟随着形势的发展,亚马逊、阿里巴巴和百度已经发布了用于深度学习的独立加速器,部分将于年内部署。而谷歌拥有三代TPU且已在其网络中运行,处于领先地位。

20190926-204.jpg
谷歌最新的TPU运行速度非常快,需要液体冷却。(来源:谷歌)

“凭借TPU,谷歌带动了整个AI加速器行业,”IDC的Rau说。

“当Hyperscalers找不到他们想要的东西时,同时又财力雄厚且有高性能需求,他们会自己来设计,”他说。“对于半导体行业来说,以更低的成本提供标准器件是一项很艰巨的挑战。”

对于许多初创公司和已建立的芯片制造商而言,上述紧张局势正引发他们对推出第一批AI加速器的焦虑。他们担心巨鲸级企业自己内部开发的芯片可能就已满足市场预期的最大需求。

长久来看,深度学习会得到广泛应用,私营企业也将转向云服务巨头来训练其神经网络,因为世界上最大的处理器群要完成这项工作也可能需要几周时间。“如果发生这种情况,我们会看到计算将更加不均衡地涌向Hyperscalers,”650 Group的Weckel表示。

Weckel担心巨鲸们会在某种情况下(由于中美贸易战而变得更加复杂)打造各自的半导体供应链,在这种情况下,任何一家半导体公司的产量,都不能产生可观的收益。“如果Hyperscalers继续投资自研芯片,他们可以直接与三星和台积电这样的代工厂合作,”Galabov说。

Hyperscalers“将在一段时间内生产自己的ASIC,但他们终究会感受压力,而回来采用更节省成本的解决方案,”Rau说。

“情况并不像看起来那么糟糕,”Linley Group的Linley Gwennap说。亚马逊和其他公司目前都只是讨论过推理,而没有开始训练ASIC,许多项目可能根本不会见诸天日。“更多可能是他们没有得到他们想要的东西,而不是他们真正想要设计自己的芯片。”

来自Facebook硬件团队的观点

最糟糕的情况是,Hyperscalers将绕过芯片供应商,就像十年前他们抛弃戴尔和惠普等服务器制造商。谷歌是首批上市的服务器厂商之一,其服务器规格毫无花哨之处,他直接与台湾的广达和纬创等ODM(原始设计制造商)合作,跳过了品牌OEM(原始设备制造商)这些不必要的盈利中间商。

结果是服务器市场“变得更加残酷”,而中国的华为和浪潮已经跻身前六位,Weckel表示。

从一定程度上讲,这种情况已经发生了。“我们已经开始直接购买光学模块,而不是从交换机供应商处购买,因为这中间支付的差价太高了,”微软的Booth表示。

微软迈出了更大的一步,于今年3月份,发布了一个新的开源RTL数据压缩标准,为Hyperscalers定义了系统规范。这个数据压缩标准是基于2011年Facebook创建的开放计算项目(OCP)。

他通过Facebook于2011年创建的开放计算项目(OCP)发布了一个新的开源RTL数据压缩标准,为Hyperscalers定义了系统规范。微软服务器工程总经理Kushagra Vaid说:“在云服务提供商中,我们首先......开创了推动RTL的新先例,希望其他企业也会跟随我们的脚步。”

OCP的另一项努力是为chiplets定义开放标准,许多人认为随着摩尔定律的放缓,这将是半导体设计的未来。OCP成员之一,芯片供应商Netronome,将致力于为集团提供其多核网络处理器中使用的800-Gbits/s结构RTL。
20190926-205.jpg
Open Compute Group旨在为chiplets定义开放规范。(来源:OCP)

另外,谷歌是RISC-V革新的早期支持者,其发布了许多新处理器核心指令集的开源代码。

长远来看,开源IP模块和工具的不断积累可能会改变芯片行业,但这一天不会很快到来。

开源硬件“与开源软件一样具有潜力,关键区别在于软件可以从零开始而硬件不行,”Facebook新硬件部门的硬件工程总监Aaron Sullivan说。 “对于硬件,你必须让其上运行的东西工作,这不像将开源代码编译成二进制那么简单。”

“我们不具有构建EDA工具和IP的核心竞争力,”Facebook的基础架构总监Vijay Rao表示,在加入社交网络之前的15年时间,Rao一直在AMD和英特尔设计处理器和EDA流程。“在Facebook,我们着眼于创建更好的基础架构,这是我们最关注的。当然如果需要构建更好的EDA工具或芯片,我们也会去做。

“对服务器OEM的去中介化并不需要太多前期投资,反而设计数据中心芯片是一项巨大的投资,而且随着向7纳米及以下工艺的推进,投资会越来越大,因此Facebook更愿意倡导而不是设计自己的芯片。”

例如,“我和20家公司进行了交流,可市场还没能为数据中心提供良好的视频编码器,因此我们向市场提供了创意并协助公司来制造它们,Broadcom和Verisilicon就是我们合作的两家公司,”Rao说。

同样,Facebook与Broadcom、Qualcomm以及公司合作,定义了推理处理器。他补充说,Facebook积极帮助设计其编译器而不是芯片本身。“如果由于数量太少厂家不愿意生产,那我们可能会自己做一些芯片。我们有AR/VR产品、Telco Infra项目,可能会需要一些EDA流程。未来有太多的事情我们可能选择去做,包括内部制造或外部制造的东西。“

微软的Booth对此表示赞同:“我们有工程师团队定义了(系统级)开关、光学器件和组件。思科有数千名工程师负责交换机设计,但微软并没有聘请这么多工程师,对我们来说,采用OEM产品或白盒系统更划算。“

七条巨鲸航线各不相同

尽管在这里我们将Hyperscalers组合在一起,但他们在社交网络、电子商务和媒体中的业务和工作量各不相同。“他们彼此竞争激烈,因此需要创新和差异化,”IHS Markit的Galabov说道。

例如,“Hyperscalers推动了与英特尔合作的新方式,”他说。“英特尔过去并不习惯定制CPU的模式,但到2018年,它向云服务客户销售的一半CPU都是定制的,高于2013年的20% ,英特尔必须学会这项全新的能力。”

光通信也出现了这种趋势,比如谷歌采用CDWDM4规范连接其数据中心。而相对后来者Facebook和微软则采用更廉价的单模光纤。“我们快把供应商逼疯了,他们希望我们所有人都有共同的愿景和方向,”微软的Booth表示。

在努力为每个巨头制造独特的产品时,半导体公司们已经忘记了传统的营销规则。根据Booth的说法,他们停止“整合多个市场的需求,并为所有市场打造同一个产品;相反,他们在拆分自己的市场。“这是一个奇怪的转变。

另一些人则指出,超过12种以太网规范已经出炉,这是标准化工作中出现碎片化的一个例子。

AI估计也会和Hyperscalers的不同需求一样,被分成不同的目标行业。“托管的加速与Facebook的加速非常不同,Facebook目前还没有托管的计划,”Rao说。“我们对我们想要的东西有深入了解,希望构建解决不同问题的加速器。我们的模型规模与其他Hyperscalers有很大不同,模型类型和参数也大不相同。“

Rao的团队已经与大多数AI芯片初创企业进行了交流,“他们并非都主攻同一领域,有些开发边缘训练,有些开发类似于Alexa的设备,这解决了问题的不同部分。”

微软的Booth赞同了这一点。“我们想要做的机器学习可能与谷歌或亚马逊想要做的有很大不同,现在,其中一些更是区分我们的AI即服务(AI-as-a-service)的秘密武器,所以,不太可能制造一台设备卖给所有人。“

有一件事情是所有Hyperscalers从始至终都专注的,那就是想尽办法节省每一分钱。

“芯片供应商很难真正理解我们所致力的运营规模,”Booth说,6年前他加入微软之前,曾在Intel、Applied Micro和Dell工作过。“那些看起来不起眼的、功耗只有半瓦特的东西,正呈爆炸式增长,聚集在一起消耗着兆瓦级的功率。”

20190926-206.png
谷歌的数十个数据中心之一(来源:Google)

监管机构会让巨鲸灭绝吗?

数据中心巨头们如今还面临着许多威胁,在2016年美国总统大选中被披露隐私泄露及其作为马前卒的丑闻之后,公众情绪已经转向他们的对立面。此外,欧盟委员会、美国司法部和联邦贸易委员会也正在进行或考虑反垄断调查。

作为审查的重中之重,Facebook的首席执行官已经做出了许多承诺,公司正朝着保护隐私和防止滥用社交网络进行运营的新方向发展。但其庞大且高度自动化的网络仍然容易泄密和受到攻击。

有传闻指出,一些迹象表明Hyperscalers已经跌落神坛不再是媒体的宠儿。一位分析师指出,那些有前途的毕业生越来越多地认为他们和硅谷一样,不再是那么有吸引力的雇主了。

但是,尽管草根阶层发起了关闭Facebook帐户的运动,这家社交网络巨头和其他hyperscalers仍在继续成长。人们无法预测未来的选举、安全漏洞和监管制裁可能会带来什么,但有经验的投资者仍押宝巨鲸将继续发展。

芯片制造商今年已初尝没有Hyperscalers的生活会是什么样子,当时巨头们在经历了两年的强劲增长之后削减了开支。IDC的Rau预测从今年秋季开始,对hyperscalers的服务器处理器整体销售将回升至约3.5%。

IHS的Galabov表示,在接下来的五年中,Hyperscalers的服务器消费量在单位和收入上会达到7.5%的增长。他补充说,规模小得多的二线云服务提供商和电信运营商的服务器支出增长速度将更快。

20190926-207.png
Galabov认为电信运营商和二线云提供商的增长速度超过了Hyperscalers。 (来源:IHS Markit)

Dell’Oro的Fung更加乐观,他预测Hyperscalers将在其十几岁的青少年期恢复增长。很多迹象表明,许多公司正持续将更多的工作转移到AWS、Azure和Google Cloud等公共云服务上。

巨鲸们掀起的下一次巨浪可能最早在明年到来,因为他们会发掘新的服务器平台、更快的网络和第一批AI加速器。建议芯片制造商们准备好他们的游泳装备迎接更大的浪潮。

在美国西部半导体展(Semicon West)上,谷歌的一位工程师说,这家搜索巨头为了追求更高的AI性能,已经彻底改变了一切,从加速器到互连和浮点格式。他邀请芯片制造商加入对驱动第四代TPU(或许是一种全新的晶体管)研究的行列中来。

这只是Hyperscalers风头正劲的众多邀请之一。半导体行业需要积极参与。

本文同步刊登于电子工程专辑杂志2019年10月刊

责编:Yvonne Geng

阅读全文,请先
您可能感兴趣
2024年第二季度,全球可穿戴腕带设备出货量实现微增,达到4430万台,增长率为0.2%。尽管市场整体增长放缓,但部分厂商凭借技术创新和产品优化,依然取得了亮眼的成绩。
2024年第二季度,设备端AI技术在智能手机市场中的应用达到了新的高度,特别是生成式AI技术的集成,成为推动行业发展的关键因素。
碳化硅(SiC)衬底已在电动汽车和一些工业应用中确立了自己的地位。然而,近来氮化镓(GaN)已成为许多重叠应用的有力选择。了解这两种衬底在大功率电路中的主要区别及其各自的制造考虑因素,或许能为这两种流行的复合半导体的未来带来启示。
2024年第二季度,在包括丰田汽车和大众汽车集团在内的大多数主要汽车制造商的销量都出现下滑的情况下,比亚迪全球新车销量达到了98万辆,同比增长40%,成功超越本田和日产,跻身全球第七大汽车制造商。
ASML再次宣布了新光刻工具的计划,该工具将扩展最高晶体管密度芯片的设计极限。据与ASML有密切合作关系的全球研发机构imec称,超数值孔径是继ASML今年初在美国俄勒冈州的英特尔半导体工厂首次安装的高数值孔径(High-NA)系统之后的又一新技术。
日本初创代工厂Rapidus的社长小池淳义在接受采访时表示,该公司将于2025年4月开设2nm试点晶圆厂。据最近访问过日本Rapidus的一位分析师称,这家台积电(TSMC)和三星的新竞争对手仍面临着巨大障碍。
• 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
点击蓝字 关注我们德州仪器全球团队坚持克服挑战,为电源模块开发新的 MagPack™ 封装技术,这是一项将帮助推动电源设计未来的突破性技术。  ■ ■ ■作为一名经验丰富的马拉松运动员,Kenji K
在全球智能手机竞争日益激烈的情况下,谁能在高端市场站稳脚跟,谁就占据了主动权。一直以来全球智能手机市场格局都是,苹果专吃高端,其他各大厂商分食全球中低端市场。但现在市场正在其变化。根据Canalys最
文|沪上阿YI路特斯如今处在一个什么样的地位?吉利控股集团高级副总裁、路特斯集团首席执行官冯擎峰一直有着清晰的认知:“这个品牌的挑战依然非常大。首先,整个中国市场豪华汽车整体数据下滑了30%~40%,
会议预告向世界展示中国最具创新力、领导力和品牌化的产品与技术!9月27号,“第6届国际移动机器人集成应用大会暨复合机器人峰会”将在上海举行,敬请关注!再度出现,能否再次“出线”?文|覃洁兰近日,曾经在
会议预告向世界展示中国最具创新力、领导力和品牌化的产品与技术!9月27号,“第6届国际移动机器人集成应用大会暨复合机器人峰会”将在上海举行,敬请关注!逐个击破现有痛难点。文|新战略半导体行业高标准、灵
‍‍据龙芯中科介绍,近日,基于龙芯3A6000处理器的储迹NAS在南京师范大学附属小学丹凤街幼儿园、狮山路小学、南京大学附属中学等学校相继落地。储迹NAS是基于最新的龙芯CPU--3A6000,其代表
8月28-30日,PCIM Asia 2024展在深圳举行。“行家说”进行了为期2天的探馆,合计报道了200+碳化硅相关参展企业(.点这里.)。其中,“行家说”还重点采访了骄成超声等十余家企业,深入了
[关注“行家说动力总成”,快速掌握产业最新动态]9月6日,据“内江新区”消息,晶益通(四川)半导体科技有限公司旗下IGBT模块材料和封测模组产业园项目已完成建设总进度的40%,预计在明年5月建成。据了
9月6日,“智进AI•网易数智创新企业大会”在秦皇岛正式举行,300+企业高管及代表、数字化技术专家齐聚一堂,探讨当AI从技术探索迈入实际应用,如何成为推动组织无限进化的新引擎。爱分析创始人兼CEO金