芯粒(Chiplet)技术如何开辟智能汽车算力竞赛发展新路径?

原创 全球TMT 2022-10-12 10:46
  • 智能汽车算力竞赛已现峥嵘,后摩尔时代的芯片厂商路在何方?
  • 时不我待,中国车载芯片企业正在崛起,谁能领跑?
  • Chiplet赋能嵌入式高性能计算,智能汽车如何获益?

上海2022年10月12日 /美通社/ -- 近年来,智能汽车行业对于大算力芯片的需求迅速增长,但是高昂的芯片成本令不少车企望而却步,影响了汽车智能化发展的速度。与此同时,一种名为芯粒(Chiplet)的技术突然火了起来,这种技术通过将一颗大芯片拆分成若干小芯片,再重新封装在一起,能够大幅降低大算力芯片的成本,用相对传统的工艺实现甚至超过更先进工艺所能达到的性价比。

芯粒技术能否解决智能汽车的算力瓶颈?专家们对此众说纷纭,有观点认为芯粒(Chiplet)技术并不适合汽车市场,这种观点是否合理?焉知特别采访了芯砺智能创始人兼CEO张宏宇,作为智能汽车芯片领域的先行者,其围绕当前行业热点问题分享了如下观点。

算力竞赛:后摩尔时代路在何方?

汽车智能化的本质是软件化。未来的智能汽车无不高度依赖于软件,而软件定义汽车的基础是高性能芯片。在智能汽车赛道的白热化竞争中,算力不足已成为一个主要瓶颈。

英伟达刚刚发布了一则轰动性新闻,推出其2000 TOPS算力的DRIVE Thor-X中央计算平台芯片;高通也不甘示弱,紧随其后发布了同等级算力的Snapdragon Ride Flex芯片。这标志着智能汽车的算力竞赛正式拉开帷幕。

但在后摩尔时代,大算力芯片的研发和制造成本居高不下,一款5nm芯片的研发费用已超过5亿美元,3nm的研发费用超过15亿美元。工艺方面,英伟达的Thor-X采用台积电4nm工艺制造,其代价可想而知。此外,大算力芯片的面积不断增大,良率随之下降,价格不断飙升,令车企叫苦不迭。

反观中国智能汽车市场,众多车企的激烈竞争使产品差异化、多样化愈发突显,伴随市场需求碎片化,芯片设计者无法摊薄制造和研发投入,更加制约了国产大算力芯片的发展,加重了汽车行业对进口芯片的依赖。

后摩尔时代,半导体行业如何破解保持低成本的同时又能满足不断增长的大算力需求难题?谁又能担此重任?

时不我待,汽车大算力芯片机会显现

面对算力需求越来越大、芯片成本越来越高的客观形势,半导体行业需有引领者挺身而出,以开放、创新的思路开辟智能汽车算力竞赛的发展新路径。

2021年11月,清华大学电子工程系90级科班出身,拥有25年国际化企业SoC产品研发及管理经验的张宏宇一手创办了芯砺智能科技(上海)有限公司(以下简称:芯砺智能),担负起利用芯粒(Chiplet)技术开辟车载大算力芯片发展新路径的使命。

作为全球首家利用芯粒技术研发车载大算力芯片的高科技初创企业,芯砺智能致力于成为智能汽车平台芯片的全球领导者。最近半年内,该公司获得了近3亿元天使轮及产业轮融资,公司的产品研发节奏持续提速。

芯砺智能CEO张宏宇在接受采访时表示:“对于半导体产业来说,现在确实是一个百年难遇的好机会,特别是智能汽车芯片领域,亟需可以超越摩尔定律的技术创新,而Chiplet是最具有实现性的选择。”

芯砺智能创始人兼CEO张宏宇
芯砺智能创始人兼CEO张宏宇

初心不改,肩负使命再度出山

创建芯砺智能,已经是张宏宇的第三次创业,1999年他在美国加入初创的掌微科技(Centrality),做的是车载导航娱乐系统的SoC芯片,可以说是吹响了汽车智能化的第一声号角。而且公司做得非常成功,到2007年已经做到全球市占率第一(超过70%),年出货量超过1000万颗车规级SoC芯片。也就是在那一年,掌微被美国上市公司SiRF以将近3亿美元的价格收购。

2015年,赛灵思(Xilinx)找他去负责SoC研发部门,因为这个部门的前任领导人去了特斯拉,和AMD的架构师Jim Keller一起为特斯拉开发FSD芯片。

他在赛灵思服务五年,做了两代高性能计算平台芯片产品 -- 16nm Ultrascale+™和7nm Versal™,都通过了车规和功能安全认证,也让张宏宇积累了更多经验。

“赛灵思让我有幸回到车载芯片这个行业,并且从高性能计算平台的角度去重新审视和思考。”张宏宇说。

近几年,异军突起的特斯拉成为汽车智能化的先驱,在汽车电子电气架构方面率先实现了中央计算平台和软硬件分离,能够通过OTA远程升级方式不断更新汽车软件和改善用户体验。特斯拉用IT技术从互联网产业视角颠覆了百年间几乎一成不变的汽车产业和传统商业模式,给汽车行业带来了新生。

这让张宏宇又一次看到了机会。如果要往软硬件分离、软件定义汽车方向发展,硬件就必须采用中央计算架构,并能提供足够的算力。放眼看,现在全球还没有一个特别适合大算力车载中央计算平台的芯片产品。

相时而动,当机立决。2020年,张宏宇离开赛灵思,开始筹划又一次创业。

独辟蹊径,瞄准智能汽车芯片算力瓶颈靶心

张宏宇认为,芯片厂商的成功取决于产品定义能否满足市场的需求。市场中有许多车企,一定会有各自不同的要求,特别是中国市场非常多元化,有一些激进者,希望采用最大算力的芯片;也有些按部就班,偏向于采用中低算力芯片。每个车企的不同车型也有不同层次的需求。对芯片公司来说,当然希望能够满足大多数客户的产品需求,要做到这一点,就需要有可以方便扩展算力的架构和相对通用的平台。但从车企角度来看,每家都希望有自己特色的差异化方案,所以两者是矛盾的。怎么解决呢?

“要解决这个矛盾,芯片的架构设计必须有两个特点。第一,有足够的通用性和可扩展性,能够对不同的客户需求有很好的适应性;第二,有足够的灵活性,能够针对一些特定客户的需求实现一定程度的定制。”张宏宇表示。

举例来说,无论是智能座舱还是智能驾驶,客户对算力的需求都不尽相同。换句话说,市场对于芯片的CPU、GPU和NPU等算力单元的配置都存在非常多样化的需求,仅仅依靠少数几款芯片无法满足。同时,每一款芯片的销量也相对有限,难以摊薄研发成本,导致芯片价格居高不下。显然,传统的技术路线存在明显的瓶颈,无法有效提供算力的扩展性和灵活性,来满足智能汽车市场的多样化需求。因此,芯砺智能选择了Chiplet作为实现中央计算平台芯片的核心技术路线。

热潮涌动,Chiplet能否突破摩尔定律天花板?

在过去数十年当中,仰赖于摩尔定律,算力需求的增长并没有对芯片的价格产生直接的压力。如今,摩尔定律已经逐渐失效,依靠更先进的工艺已经无法降低大算力芯片的高昂成本,因此Chiplet技术得到了越来越多芯片厂商的青睐。但是,Chiplet在超越摩尔这条路上到底能有多大作用呢?

张宏宇认为:“作用非常大,而且是未来几年真正可实现的超越摩尔定律的一条路。”后摩尔时代,Chiplet是被寄予厚望的异构集成技术。它是在封装中集成多个不同功能的小芯片(裸片),这些小芯片可以采用不同架构甚至不同工艺,所以叫异构集成。之所以说Chiplet最现实,是因为其在服务器领域已经成功应用,AMD在过去5年中业务发展得非常好,原因就是Chiplet做得好。

Chiplet解决了服务器领域最先碰到的扩展性和算力瓶颈的问题。比如,原来CPU是8核、16核、32核,现在是64核、128核,如果用单芯片,芯片会越来越大,越来越贵,甚至无法制造。

为此,服务器芯片供应商率先改变方式,将大芯片拆成小芯片再拼装,用先进封装和异构集成来解决问题。当然,Chiplet也不能跟先进封装完全划等号,而且先进封装在车载芯片的可靠性方面尚未得到验证,成本也相对较高。先进封装概念涉及硅片设计和晶圆制造,不同的小芯片通过硅中间层实现互连,中间用TSV(过孔)互连,挑战很大。况且,目前具有规模化先进封装生产能力的,只有台积电、英特尔、三星等少数厂家。张宏宇说,Chiplet完全可以通过传统封装来实现,从而满足车载芯片可靠性和成本控制的要求。当然,这需要在Chiplet互连技术上有一定的创新。芯砺智能在这方面有自主研发的IP,来降低对封装技术的要求。

此外,要真正做好Chiplet,还要有创新的架构设计。

芯片拆小后带来的直接好处是良率提升,因为芯片面积越大,良率就越低;良率越低,成本就越高。把芯片拆小解决了产品良率问题,降低了成本。不过,客户要的不仅仅是更低的成本,还需要更高的性价比。成本下降是好事,但芯片拆分之后性能也会下降。因为一颗芯片内部的通信效率一定比多颗芯片之间的通信效率要高,所以拆成小芯片后要维持性能的稳定也是一个难题。

要解决这个问题,首先是从架构设计上解决怎么“拆”,像庖丁解牛那样充分了解不同的系统架构和数据流,知道在哪里下刀;然后才是“合”的问题 -- 采用合理的互连和封装技术进行集成。

贵在创新,Chiplego(芯砺)开辟算力竞赛新路径

芯砺智能独创的Chiplet互连技术能提供高带宽、低延迟的片间(die-to-die)互连总线,结合创新的嵌入式高性能计算平台(eHPC, embedded High Performance Computer)芯片架构,可利用相对成熟的半导体制造和封装技术,突破对先进工艺的依赖。

eHPC平台主要针对需要高算力和低成本的新兴需求。本来两者是矛盾的,因为高算力一般意味着高成本,像服务器芯片;低成本一般就意味着低算力,像移动计算芯片;如果像车载算力平台芯片那样,既要高算力又要低成本,就需要创新的eHPC架构以及Chiplet技术来实现。

车载中央计算平台芯片的性价比很重要,生态也很重要,后者决定芯片是不是好用。任何产品要让客户愿意买单,两者缺一不可。如果用Chiplet实现芯片异构集成,同时把底层软件和工具链集成好,客户拿去以后,只要把上层软件和算法放上去跑就够了。不同算力配置的系统软硬件基本上能够兼容,无论是2000TOPS还是100TOPS的NPU算力,无论是10TFLOPS还是1TFLOPS的GPU算力,客户都不需要改变其开发环境。这样,既简化了系统集成,又能方便应用创新。

芯砺智能的产品是车载中央计算平台芯片,技术路线是Chiplet异构集成,秉持的是一种开放的心态:Chiplet所集成的多颗小芯片不一定都是自己的,可以开放其中一部分,就像特斯拉中央计算平台方案中有自研的FSD芯片,也有其他厂商的芯片那样。

“我们要做的是赋能整个产业,不能单打独斗,芯砺智能的Chiplet互连接口可以开放给更多的厂商使用。”张宏宇说。

孰轻孰重?半导体企业的“大”与“强”

半导体企业如何才能做大做强呢?张宏宇认为:“半导体企业最重要的是做强,做强了才能做大,做大了未必能做强。”如果依靠国产替代,或许能够解决从0到1的问题,但要解决企业从1发展到100的问题,首先必须依靠过硬的产品,才能够在激烈竞争的市场上生存下来,然后再通过不断积累的技术优势,逐步赢得越来越大的市场份额。

“做企业不能太急功近利,要扎扎实实建立一些差异化的核心竞争力,这需要花时间,光靠买一些技术不可能做强做大。”他说。

据张宏宇介绍,目前公司成立还不到一年,已经有150多人的团队,到年底将接近200人。在产品研发进度方面,速度至少比国外大公司快一倍,因为团队既有丰富的实战经验,又有高昂的斗志和拼搏精神。

“芯”笃行远,赋能智能汽车高效更“芯”换代

Chiplet技术路线兼具灵活扩展、降低成本、提高良率和加快产品上市等优势,是公认的后摩尔时代半导体产业针对大算力芯片的最优解之一。在产业链上下游企业的共同推动下,Chiplet正在不断扩大其商业应用版图。

芯砺智能对智能汽车市场的需求有自己独到的见解,并拥有一系列差异化的核心竞争力,特别是在Chiplet等核心技术方面的积淀和创新。不仅有先进、开放的并行计算架构、算力内核和高效、完整的工具链,而且与生态合作伙伴密切协同,能够为客户提供具有差异化特色、灵活可定制、全球领先的车载大算力平台芯片及解决方案。在智能驾驶、智能座舱和舱驾一体等不同应用、大跨度差异化需求高速增长的当下,芯砺智能正在帮助智能汽车产业高效地更“芯”换代,开辟智能汽车算力竞赛的发展新路径!

全球TMT 每日精选新鲜、有趣、重要的企业与机构新闻,由全球领先的企业新闻专线美通社(PR Newswire)为您呈现。
评论 (0)
  • 一、系统概述MYD-LD25X搭载的Debian系统包含以太网、WIFI/BT、USB、RS485、RS232、CAN、AUDIO、HDMI显示和摄像头等功能,同时也集成了XFCE轻量化桌面、VNC远程操控、SWITCH网络交换和TSN时间敏感网络功能,为工业设备赋予“超强算力+实时响应+极简运维”的体验!类别名称描述源码TF-AArm Trusted Firmware 2.8OP-TEEOP-TEE 3.19BootloaderU-boot 2022.10KernelLinux Ke
    米尔电子嵌入式 2025-03-07 14:08 250浏览
  • 文/Leon编辑/cc孙聪颖2025年全国两会进行时,作为“十四五”规划收官之年,本届两会释放出坚定目标、稳中求进、以进促稳等信号。其中,企业家们的建议备受关注,关系到民营经济在2025年的走向。作为国内科技制造业的“老兵”,全国人大代表、TCL集团创始人及董事长李东生在本届两会中提出三份代表建议,包括《关于优化中国科技制造业融资环境的建议》、《关于加强AI深度伪造欺诈管理的建议》和《关于降低灵活就业人员社会保险参保门槛的建议》,表现出对科技制造、AI发展和劳动者保障方面的关注。会后,李东生接受
    华尔街科技眼 2025-03-06 19:41 149浏览
  • Sub-GHz,即工作频段低于1GHz的无线通信技术,常见频段有315MHz、433MHz、868MHz与915MHz等。其可借助无线电波在自由空间传播的特性,把数据调制到射频载波上进行传输,达成物联网设备间的无线通信,是物联网设备实现高效、稳定、无缝交互的“通信基石”。典型射频信号(无线电波)收发电路简示在工业自动化、智慧城市、智慧农业与智能家居等物联网领域中,LoRa、Wi-SUN、Z-Wave、Sigfox等工业级通信协议大多运行在Sub-GHz频段。而正是通过Sub-GHz射频技术,传感
    华普微HOPERF 2025-03-07 11:39 167浏览
  • 在六西格玛项目中,团队的选择往往决定了最终的成败。合适的团队成员不仅能推动项目顺利进行,更能确保最终成果符合预期。因此,组建六西格玛团队时,必须挑选最合适的人才,确保他们具备必要的能力和特质。团队主管的关键特质每个精益六西格玛项目都需要一位主管来带领团队。他们不仅需要具备领导力,还要能够分析数据、制定策略,并与管理层和团队成员高效沟通。团队主管的核心职责包括:领导团队行动:能够激励成员,确保团队朝着既定目标前进。数据分析能力:精通数据处理和分析,能基于数据做出决策。沟通协调:能够在管理层和团队之
    优思学院 2025-03-06 12:51 132浏览
  • 服务器应用环境与客户需求PCIe 5.0高速接口技术的成熟驱动着生成式AI与高效能运算等相关应用蓬勃发展。在随着企业对服务器性能的要求日益严苛,服务器更新换代的周期也持续加快。在此背景下,白牌与DIY(Do It Yourself)服务器市场迎来了新的发展契机,但同时也面临着更趋复杂的技术挑战。传统上,白牌与DIY服务器以其高度客制化与成本效益优势受到市场青睐。然而,随着PCIe 5.0等高速技术的导入,服务器系统的复杂度大幅提升,对组装技术与组件兼容性也就提出更高的要求。举个简单的例子来说,P
    百佳泰测试实验室 2025-03-06 17:00 169浏览
  • 概述随着工业4.0的深入推进,制造业对自动化和智能化的需求日益增长。传统生产线面临空间不足、效率低下、灵活性差等问题,尤其在现有工厂改造项目中,如何在有限空间内实现高效自动化成为一大挑战。此次项目的客户需要在现有工厂基础上进行改造,空间有限。为此,客户选择了SCARA型线性轴机器人作为执行设备。然而,SCARA机器人的高效运行离不开强大的控制系统支持。宏集凭借其先进的智能控制系统,为客户提供了高效、灵活的自动化解决方案,确保SCARA机器人在有限空间内发挥最大效能。一、客户需求在此次改造项目中,
    宏集科技 2025-03-06 11:27 208浏览
  • ​CS6212是一款可分别用于USB Type-C主机/显示端口源应用的带重定时的有源开关。这设备符合USB 3.2标准版本1.0和USB Type-C标准上的VESA DisplayPort Alt模式 1.0版,支持通过GPIO或12C进行灵活的模式切换。此设备支持USB 3.2第2x1代 运行速度高达10Gbps,DisplayPort 1.4运行速度高达HBR3 8.1Gbps。CS6212管脚分布及功能定义:CS6212支持重定时器训练,并支持USB 3.2标准中定义的状态状态机(RT
    QQ1540182856 2025-03-07 10:09 166浏览
  •        深夜的公园里,当路灯熄灭后,传统监控摄像头只能拍出模糊的黑白画面,仿佛老式胶片电影里的场景。而搭载为旌瑶光ISP的摄像头,却能像猫科动物一样,在几乎全黑的环境中捕捉到行人衣服的颜色、树叶的纹理,甚至快速跑动的宠物狗毛发细节。这种从“黑白默片”到“全彩4K电影”的跨越,背后是为旌瑶光ISP对传统红外补光技术的颠覆性创新。一、传统方案之困:被红外光“绑架”的夜视世界        传统安防摄像头依赖红外
    中科领创 2025-03-07 16:50 335浏览
  • 在企业管理和职场环境中,权力是一个常被提及却又让人感到微妙的话题。有人觉得它充满吸引力,有人却对它避之不及。然而,不管你对权力的态度如何,理解它、掌握它,甚至善用它,都是职场成功的重要一环。今天,我们就来深入探讨权力的本质,特别是个人权力和社会权力的区别,以及如何在职场中逐步建立属于自己的影响力。权力的两种面貌:你掌控自己,还是掌控他人?说到权力,首先要区分它的两种类型。个人权力是你对自己生活的掌控感。比如,你能自由决定自己的职业方向,不用总是请示他人。这种权力让人感到踏实和满足,是我们在生活中
    优思学院 2025-03-07 15:56 216浏览
  • 近年来,越来越多的企业在5S管理的基础上,开始追求6S、7S甚至8S管理,仿佛S越多,管理就越先进,企业就越优秀。于是,6S增加了“安全”,7S又加上了“节约”,8S甚至引入了“学习”……看似更加全面,实则很多企业只是机械地增加S,却忽略了管理的核心目标:提升效率、降低浪费、优化工作环境。优思学院认为,5S本身已经是一套成熟的精益管理工具,它的核心理念不仅简单高效,而且易于实施和推广。如果企业只是为了赶时髦,盲目增加S,而没有真正理解5S的本质,那么这些额外的“S”很可能会变成管理上的负担,而不
    优思学院 2025-03-07 12:43 207浏览
  • 深圳触觉智能RK3506开发板现已上市,开启预售!搭载瑞芯微RK3506B/J超低功耗工业处理器(1.5GHz三核A7+M0,主频1.5GHz);支持1280×1280显示、双百兆网口、星闪无线三模,板载高达2路CAN FD与5路串口。RK3506适用场景简介工业控制‌:RK3506适用于工业控制、工业通信、人机交互等应用场景。其多核异构架构(3xCortex-A7+Cortex-M0)和外设接口丰富,支持Buildroot、Yocto系统,适合轻量级HMI应用‌。‌工业通信‌:RK3506均支
    Industio_触觉智能 2025-03-07 10:04 136浏览
  • ASL6328芯片支持高达 6.0 Gbps 运行速率的交流和直流耦合输入T-MDS 信号,具备可编程均衡和抖动清理功能。ASL6328 是一款单端口 HDMI/DVI 电平转换 / 中继器,具有重新定时功能。它包含 TypeC双模式 DP 线缆适配器寄存器,可用于识别线缆适配器的性能。抖动清理 PLL(锁相环)能够消除输入抖动,并完全重置系统抖动容限,因此能更好地满足更高数据速率下 HDMI 抖动合规性要求。设备的运行和配置可通过引脚设置或 I2C 总线实现。自动断电和静噪功能提供了灵活的电
    QQ1540182856 2025-03-06 14:26 137浏览
  • 多人同时共享相同无线网络,以下场景是否是您熟悉的日常?姐姐:「妈~我在房间在线上课,影音一直断断续续的怎么上课啊!」奶奶:「媳妇啊~我在在线追剧,影片一直卡卡的,实在让人生气!」除此之外,同时间有老公在跟客户开在线会议,还有弟弟在玩在线游戏,而妈妈自己其实也在客厅追剧,同时间加总起来,共有五个人同时使用这个网络!我们不论是在家里、咖啡厅、餐厅、商场或是公司,都会面临到周遭充斥着非常多的无线路由器(AP),若同时间每位使用者透过手机、平板或是笔电连接到相同的一个网络,可想而知网络上的壅塞及相互干扰
    百佳泰测试实验室 2025-03-06 16:50 162浏览
  • 深圳触觉智能SOM3506核心板现已上市,搭载瑞芯微RK3506B/J超低功耗处理器(1.5GHz三核A7+M0),低功耗满载仅0.7W,支持40℃~85℃工作环境,即日起宽温级59元/工业级68元,特价开售!芯片介绍RK3506是瑞芯微Rockchip在2024年第四季度全新推出的Arm嵌入式芯片平台,三核Cortex-A7+单核Cortex-M0多核异构设计,CPU频率达1.5Ghz, M0 MCU为200Mhz。RK3506适用场景简介工业控制‌:RK3506适用于工业控制、工业通信、人机
    Industio_触觉智能 2025-03-07 10:03 165浏览
  • 随着自动驾驶技术的迅猛发展,构建高保真、动态的仿真场景成为了行业的迫切需求。传统的三维重建方法在处理复杂场景时常常面临效率和精度的挑战。在此背景下,3D高斯点阵渲染(3DGS)技术应运而生,成为自动驾驶仿真场景重建的关键突破。一、3DGS技术概述与原理1、3DGS的技术概述3DGS是一种基于3D高斯分布的三维场景表示方法。通过将场景中的对象转化为多个3D高斯点,每个点包含位置、协方差矩阵和不透明度等信息,3DGS能够精确地表达复杂场景的几何形状和光照特性。与传统的神经辐射场(NeRF)方法相比,
    康谋 2025-03-06 13:17 331浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦