Credo是一家提供安全、高速连接解决方案的公司。近期,Credo公布了2025财年第一个季度的业绩,营业收入同比增长了70%左右,人工智能AI占主要驱动力。当前Credo大概有550名员工,技术开发重点在上海,在大中国区的南京、武汉、香港和台湾都有办公室,其中,三分之二的技术团队在国内。
经过多年的发展,Credo的产品和服务包括交换机线卡PHY芯片、光芯片(DSP)、有源线缆(AEC)、SerDes IP(IP授权)、Serdes Chiplet(小芯片)等,客户目前分布在人工智能、各类数据中心、电信和高性能计算等各个领域。
2008年,Credo在上海成立, 2015年,Credo迎来了第一款SerDes IP产品的面世,有了第一家客户。紧接着,Credo在高速串行连接技术下,做出了一款PHY Retimer芯片。Credo业务销售副总裁杨学贤(Simon Yang)表示,“到目前为止,这种PHY Retimer芯片还是Credo非常稳定增长的一条产品线,为我们后面的一些产品的发展打下了很好的基础,也进一步锻炼了我们整个团队。”
在2018年,芯粒(chiplet)技术在行业内刚刚开始兴起,Credo也推出了多款chiplet产品,在交换机和人工智能中应用,包括一些超算集群。
Credo每年都会推出新一代的DSP产品,目前已经做到了第五代光DSP产品。
2019年,Credo推出了创新性产品——AEC。在互联速率没有超过100G的那个年代,传统的无源连接线缆被称为DAC,也就是无源铜缆,用户将其服务器连接到交换机的传统方法之一就是采用DAC来做互联。随着数据数率自400G、800G到1.6T的往上递增,信号格式从NRZ向PAM4转变,DAC线缆就会变得越来越粗重,这是因为它们的信号随速率提升衰减太快了,没办法在高速连接中规模商用。AEC也是一根铜缆,Credo在线缆两端的连接头里面集成了基于Credo自有铜DSP技术的Retimer,来负责端到端的信号传输。当AEC插入系统上,系统要做的工作就仅仅是把信号传输到线缆的插入端即可。相对应的,尽管是数据速率达到了1.6T,也能保持非常细的线径。这款产品在被北美的一些互联网大AI应用中得到广泛应用。
随着AI时代的兴起,国内互联网企业也注意到AEC的价值。Credo开始关注如何把AEC更好的应用在国内的数据中心市场中。今年,Credo针对国内市场需求,根据相应的数据中心的数率以及应用场景的差异化等,推出适用于国内需求的400G Q112网络接口的HiWire SHIFT AEC(有源电缆Active Electrical Cables)新系列产品。据悉,Credo现有产品可以覆盖100G、200G、400G、800G和1.6T这些速率,在成本上和功耗上相对AOC产品有明显优势。Simon表示,“AEC这样一个产品在AI/ML浪潮中被互联网大厂关注并被加以应用的一个很重要的原因,就是它的连接可靠性比光缆高出一到两个数量级,这是我们的一些客户实际得到的一些测试数据。”
“在AI应用中,从整个集群的角度来看,算力利用率还是蛮低的;导致算力利用率低的原因就是互联的问题,一旦一个节点发生了故障或者链路断掉,之后的传输就要重新再传,然后就造成了基本上只有40%-50%的算力利用率。通过AEC互联帮助我们客户去大幅提高整个连接的可靠性,就可以帮助整个算力集群大幅度提高利用率。这也是为什么在整个AI社群里大家都在再一次重视铜互连和电互联的重要原因”
2023年,Credo推出了连接盒子——P3(Pluggable Patch Panel)盒子,在高速互联的场景中,它们连接的形态越来越多、端口也越来越多,比如说像100G、200G、400G和800G,有时候都混在一起,就要去考虑怎么样能够把整个系统搭建得更完美,P3(Pluggable Patch Panel)盒子能够将不同速率和不同端口的光模块连接集中在一起实现统一的互联,以解决整个系统级互联的一些问题的产品。
随着数据中心和AI基础设施不断扩大规模和提升速度,能效变得非常重要,Credo也创新性的提出了线性接收光路(LRO)的解决方案。
简单的来说,Credo在芯片级的互联,提供了SerDes IP;在设备内部的互联对应提供了PHY芯片;在设备外的互联,提供了用于在机架间短距离互联的AEC产品以及传输距离更长的不同速率的光DSP芯片;从芯片封装级的die-to-die,到chip-to-chip, chip-to-module,一直到设备之间和不同机架之间的互联,都有对应的技术和产品,提供端到端的解决方案。
近几年,光传输需求为何如此强烈?
在当今的数据中心领域,网络正在经历巨大的变革。每一个数据中心有两种网络连接。一种是传统的前端网络,还有新的一种是用于AI网络连接的后端网络(backend network)。
现在后端网络将所有 GPU 连接在一起,当训练一个需要消耗很多电力的模型时,就需要几千个GPU,后端网络使这一切成为可能,形同数据中心里的一台大计算机。这也使得后端网络的带宽是前端网络带宽的8~10倍。
根据Credo光产品销售及市场助理副总裁Chris Collins的介绍,不同客户数据中心的架构是不同的,而不同的AI系统的架构就决定了它需要使用哪种类型的光纤收发器。传统的架构是基于空气冷却技术的风冷方式。由于功耗的限制,使用风冷技术时,每一个机架只能放1~2台的服务器,这就导致了如果需要使用很多服务器的话,就只有放在很多个机架上而且机架间的分布还需要有比较远的间隔,你还需要使用光缆去连接这些机架。因此,传统光纤链路比现代、较新的数据中心使用的光纤链路长得多。
一些数据中心中液冷服务器开始流行起来。采用液冷方式是因为可以使用液体提取热量,就可以在一台机架上放很多台AI服务器,也可以使用不同类型的连接方式。这样服务器之间的连接距离就会变短,可以使用更多的有源电缆(AEC)。数据中心用户在其网络中也可以做出其他选择。他们可以使用单通道50G 端口,也可以使用单通道100G的端口,他们也可以使用12.8T的交换机,这些都取决于想要组建的网络类型以及想要连接的不同设备的数量。因此根据需要构建的数据中心的类型,可以选择不同类型的光学器件。
Chris表示,“Credo专注于高速互联技术,为我们所有的产品线带来了相应的专业能力。AEC和DSP的使用场景都是插入到类似的交换机或网卡中,因此,团队之间可以共享我们学到的经验和知识,让我们的所有产品都有更好的表现。”
“今天的市场对光互联和诸如AEC等各种互联解决方案的需求十分旺盛,行业也非常看好具有创新能力的新供应商。客户希望找到交期更短,功耗更低的解决方案,这正是我们Credo为市场带来的价值。对于我们新推出的诸如LRO或者更纤细的AEC等创新替代解决方案,市场都给予了积极的回应和拥抱。因此,我看到了Credo在所有不同领域内正在实现快速增长。”
满足中国市场AI/ML网络连接需求的新品
Credo的400G Q112网络接口的HiWire SHIFT AEC(有源电缆Active Electrical Cables)新系列产品,主要是为了中国超级数据中心市场量身打造的,可以满足AI/ML后端网络与TOR交换机之间的网络连接需求。
该新系列SHIFT AEC产品是基于Credo先进的800G HiWire AEC设计优化而来,相较于光模块,MTBF(平均故障间隔时间)显著提高,这一点对AI/ML应用而言至关重要。目前,该系列新品正处于样品测试阶段,预计于2025年一季度正式量产。
和传统的无源DAC甚至一些场景中的AOC相比,AEC的优势是什么?
首先,AEC具有低功耗,一个400G的AEC的单端功率在5瓦左右,它与一个400G的光模块相比,功耗可以降低大约50%。
其次,在实际的机架部署中,更细更轻的AEC相较于DAC更易于规整和管理,因此它们不容易阻挡机架的空气流影响散热,使机架易于管理和高效使用。由于AEC里面没有光学组件,其生命周期更长,可靠性更高。不仅在安装时可以折弯和盘卷,甚至可以接受重物承压。
AEC线缆的端头植入了DSP芯片,可以实现DAC线缆无法提供的功能,例如传输速率的转换,可以把一端单通道50G的信号转换成另一端单通道100G的传输速率。
AEC产品是一种符合IEEE标准的标准化的产品,它的应用非常广泛,新系列HiWire SHIFT AEC包括以下产品:
- 400G QSFP-112 (4x112) ⇄ 2* 200G QSFP-56
- 400G QSFP-112 (4x112) ⇄ 2* 200G QSFP-112
- 400G QSFP-112 (4x112) ⇄ QSFP-112 (4x112)
AEC产品负责人Ameet Suri表示:“为了满足中国超级数据中心市场客户对Q112 TOR接口的需求,Credo 拓展其800G HiWire AEC产品系列,推出包含三款Q112新品的HiWire SHIFT AEC新产品系列。HiWire AEC 不断受到超级数据中心运营商们的青睐,被用于NIC与TOR之间的连接。我们期待借助此次推出的AEC新品,进一步提升AEC解决方案在中国市场的渗透率。”
650 Research的负责人Alan Weckel表示:“QSFP112将成为中国超级数据中心市场中AI/ML网络连接关键节点。对于寻求低能耗、高效能、可信赖解决方案的中国新客户而言,无疑会优先考虑在AEC领域占据领先地位的Credo。”