存算一体芯片怎么搞?我们和「后摩智能」研发一号位聊了聊

超电实验室 2023-05-19 15:01




换道抢跑,性能直逼英伟达

作者|在洲

冷静,理性,且对芯片行业充满敬畏。

和后摩智能联合创始人、研发副总裁陈亮对话的一个小时的时间里,他少有情绪上的变化,不过每次谈及技术相关的话题,他总会加重语气,讲起来滔滔不绝,对芯片制造和设计问题如数家珍。

5月10日,是后摩智能成立两年来最重要的里程碑,公司研发两年的存算一体大算力AI芯片产品——鸿途H30亮相,“就像自己培养的孩子开始接受检验一样。”

鸿途H30是国内第一款量产存算一体智驾芯片,于行业来说,将多了一个底层架构完全不同的大算力AI芯片的选择,于后摩来说,公司第一款产品,终于等到推向市场的时刻。

存算一体的优势在于,打破了现代计算机技术中冯·诺伊曼架构的存储墙和能效墙的瓶颈,既存储数据也能处理数据,可以显著提升能效比,实现大算力、低功耗。而且存算一体芯片,不需要依赖先进制程工艺和封装技术,成本大大降低。

基于这种底层逻辑的创新,让鸿途H30有了和大厂产品掰手腕的底气。

从账面数据来看,这款后摩花两年打造的芯片足够惊艳。鸿途H30基于 SRAM 存储介质,最高物理算力可以达到256TOPS,典型功耗 35W,在 Int8 数据精度条件下,其 AI 核心IPU 能效比高达 15Tops/W,是传统架构芯片的7倍以上。

鸿途H30还支持运行点云网络,以及BEV网络,能够支持 L2+ 到L4 级自动驾驶。此外,这颗芯片采用了更加灵活的散热方式,车企可以实现更低成本的部署,开源的通用计算平台,也大大降低了主机厂开发的成本,并缩短适配周期。


在陈亮看来,车企搭载存算一体芯片,无论耗费的时间还是资金,都是一笔非常划算的买卖。

作为公司首款产品,鸿途H30的重要性不言而喻,但面对如此重要的时间节点,陈亮并没有太大波动,“平常心就好”。

在他看来,举办产品发布会只是第一步,后面还有很多工作要做,比如要做到量产,要满足客户的要求,还要卡在6月节点送测等。

虽然存算一体芯片行业站在爆发前夜,但产业化尚处于起步阶段,无论是初期开发还是产业链上下游适配,都在摸着石头过河。

陈亮清楚,作为存算一体行业的先行者,前路定会荆棘遍布。“被别人赶超也是好事,即便我们这个公司做不成,做这件事的价值还是非常有意义。”

作为在芯片行业扎根十几年的老人,陈亮认定了公司选定的方向不会错。基于芯片底层技术创新,其存算一体产品在同样的性能下功耗会低很多,同样功耗下性能会高很多。即便行业处于拓荒阶段,陈亮仍然笃定地认为,存算一体将会是未来人工智能发展的必然方向。

“我们用两年时间做到了业界没有人做到过的事情,真心为公司每一个人感到骄傲。”

在后摩智能这家初创公司里,还有很多像陈亮这种对于技术有着极致追求的研发人员,他们在待遇和公司体量都稍逊的情况下,仍然选择了后摩智能。“看中的就是从底层做起,还拥有技术创新。”

陈亮本硕博毕业于清华大学,曾任海思CPU芯片资深架构师、地平线AI芯片首席架构师具备10余年高性能CPU/FPGA/ASIC芯片内核设计及量产经验,主导过多款AI芯片设计,拥有美国及中国芯片相关发明专利近20项。


站在2023年这个时间节点,即便一些自动驾驶解决方案供应商大打价格战,并把产品做到几千元的成本,陈亮也不担心鸿途H30的产品力,因为“不能只看价格,还要看价值。

以下是猎云网与后摩智能联合创始人、研发副总裁陈亮的对话:(略经整理)

01 
时机已成熟

Q:两年前为什么会选择加入后摩智能?

A:2021年初,吴强(后摩智能创始人兼CEO)给我打了一个电话,说可以一起做存算一体芯片,当知道了他的想法和对公司的战略时,我没有考虑太久,很快就选择加入进来。因为后摩智能创立之初就选择从底层做起,还有技术创新。

而且存算一体带来的技术和产品的优势,和智能驾驶的关键需求天然吻合,因为智能驾驶的终局是要替代人的驾驶,我们用传感器代替人的眼睛,用各式各样的算法填补人的意识和灵魂。底层的智能驾驶芯片又扮演着人类大脑的角色,所以从终局的角度来看,智能驾驶芯片一定要无限接近人大脑的行驶和效率。

Q:发布会现场,你说很多人选择后摩智能的时候,薪资不是重要的考量因素。

A:是的,我们团队每个人都在专心做好自己的事情,觉得我们做的事非常有价值,每个人在这里都可以充分发挥自己的积极性,表达自己的想法,团队每天都非常有活力,这是他们最看重的。

Q:可以介绍一下团队研发人员背景吗?

A:团队基本都是科班出身,既有来自英伟达、海思、高通、寒武纪等芯片企业,也有来自阿里巴巴、百度等科技公司,主要以具有存算一体领域原创科研能力的人为主。

Q:现在研发部门有多少人?

A:研发团队占公司人数一半以上,有百分之七八十都是研发人员。

Q:两年来最大的收获是什么?

A:最大的一个收获就是要考虑的事情确实是更多了,比如人的因素、产品、客户等各个方面要考虑的因素更多。而且要把一件事或者一个很好的想法变成现实,需要综合各个方面考虑,而不能是像一个工程师一样去处理,按照工程师的思维,没办法运营公司。


Q:接下来最重要的一件事是什么?

A:最重要的其实有两件事,一个是我们第一代芯片交付,第二件事就是第二代芯片的研发。

02 
 价值比价格更重要

Q:新产品发布之际,自己的心情如何,激动吗?

A:没有什么特别的心情,继续做该做的工作,激动也谈不上,因为后面还有很多工作要做,要量产、要给客户送测,然后产品很多功能都要做,平常心吧。

Q:目前这个产品节奏符合自己的预期吗?

A:基本符合,当然我们希望能够越快越好,不过我们的AI处理器以及存算电路等,完全都是自己做的,这就意味着需要比别人做更多的工作,也会更深1~2个层次,所以也不能着急。

Q:那你们接下来如何说服车企搭载自己的产品?

A:首先从产品角度来说,鸿途H30有着256T的AI物理算力,这么大的物理算力,在当前的国内AI芯片是第一个。它的典型功耗只有35W左右,能效是其他产品的几倍,是目前国内效率最高的大算力智能驾驶芯片。

而且35W是我们芯片和一个主控芯片,两个加起来的功耗,我们单个芯片的功耗其实只有20W到25W。

从开发的角度来说,存算一体技术是对开发者无侵入式的底层架构创新,从编程角度来看用户感知不到任何底层硬件的影响,再有我们也会做一些车规的认证,这方面也不存在障碍。

Q:不过现在自动驾驶行业其实非常内卷,一些自动驾驶解决方案供应商都在压低价格,很多成本都控制在了万元以内,你们怎么看?

A:芯片的价值不在于单颗芯片的价格,不在于说卖多少钱一片,而在于长期上带来的好处,单一价格不能等同于价值。如果真是在要问多少钱一片的话,同样的性能,我们芯片的面积比其他产品小三倍,就是在同样的性能条件下功耗更小,功耗小带来的是整个系统成本的降低,其中就包括散热成本。

我们下一代产品就会主打自然散热,不需要风冷或者散热这些配件,可以为主机厂节省更多的成本。所以真正有价值的东西,不用局限于单一价格的衡量标准,需要从整体来看。


Q:发布会当天你们宣布了一个彩蛋,说是要设计开源,具体开放了哪些能力?

A:我们计划的开放是非常底层的,未来会开放整个硬件的设计,然后配合我们的软件工具链,就可以把我们的硬件设计直接用在自己的产品中。

大家可以在我们网站上下载IPU设计资料,在此基础上就可以做PPA的评估,做软件算法的开发。我们希望有更多的人和组织能够参与进来,相信以大家的智慧可以更好的让这个方向落地,大家可以共建生态,最终让整个产业链受益。

Q:所以你们设计开源也有打造生态的考虑?

A:是的,首先我们还是把自己定位为Tier 2,我们所做得是最底层的通用计算平台,这个计算平台包括了硬件底层的操作系统,上层的应用算法都是交给客户或者合作伙伴去做。

我们的芯片采用HDPL语言编程,它是我们IPU架构的CUDA语言拓展,金融CUDA的前端语法和CUDA运行时,高效解决了数据并行问题,而且支持消息传递机制。我们的Tile内部是有异构的计算单元组成的,所以我们在核内采用异构的SIMD编程模型。

而在核间、Tile间都是同构的设计,所以采用CMT的编程模型。像一些底层复杂的机制,比如数据共享,消息传递等等,都被我们出色的软件工具链团队包装起来。大家只要使用我们的开发套件,使用一些非常简单的简洁易用的编程接口,就可以在我们的IPU上高效的开发自己的软件和算法。

03
 不担心被赶超

Q:在创投圈一直有个说法,就是初创公司做的这件事,BBA做了怎么办?你们怎么看待这个问题?

A:所有的初创公司都会面临这个问题,但你看还是有很多公司会活下来。与其杞人忧天地揣测会不会被大厂超越,不如先关心自己怎么能把产品做得更好。

我们作为一家初创公司,选择了一个相对前沿的技术路径,就是要做出人无我有、人有我优的产品。做芯片不是一蹴而就的,从硬件到软件,每一个环节都依赖于有效打磨,其中的先发优势不仅在于时间和资源,更重要的是工程化验证的有效经验。

Q:存算一体虽然处于爆发阶段,但智驾芯片的同行者并不多,后摩作为第一个吃螃蟹的人,会不会担心被后来者赶超?

A:我觉得赶超也挺好的,存算一体这个赛道值得更多人加入,就算这个公司做不成,我们做这件事的价值也不会消失,无论我们最后能不能成功,对于行业来说都是具有意义的。


Q:开发第一款量产存算一体芯片,在设计过程中有没有遇到一些难题?

A:确实有好多问题都是之前没有遇到过的,比如去年,我们发现存算电路会在非常偶然的情况下会出现计算的错误,无论怎么做试验总是找不到原因。

这个问题不解决,不管是性能还是良率都会出现问题。最后我们都几乎绝望了,甚至怀疑是不是有三体人发射质子来封锁我们的科技。好在反复确认后,发现就是因为电路里一个小小的行为没有反映在行为模型里导致的。

Q:这也说明开发过程中会产生很多意想不到的问题,其实自动驾驶技术的发展迭代本就是发现问题解决问题的过程,你们又是如何在交付非常紧张的情况下,保持技术领先性和应用的?

A:从技术的角度领先性的角度来说,我们的设计本就比其他产品的更深至少1~2个层次。我们也在不断迭代电路,优化的过程没有止境的,即使是用同样的工艺,也可以不断优化。有专门的架构和算法的团队去做更前沿的设计和研究,我们基本上是在实施一代、设计一代,然后再预演下一代的节奏在跟进。

Q:对于自动驾驶芯片来说,产品亮相往往是第一步,接下来还有更大的门槛,比如交付的压力和工程化的问题,你们怎么去解决这些问题?

A:芯片良率问题我们已经解决了,我们的芯片没有良率很低的问题。我们也会尽全力配合客户做相应的适配工作。不过我们是做的通用的计算平台,设计更加开源,可以最大程度保持用户的开发习惯,所以和用户适配的周期更短,相应地,用户花费的时间和资金成本也会更低。

至于工程化的问题,我们从设计、封装到成品的流程已经走通了,没有什么障碍。

Q:在接下来和主机厂合作的过程中,如果遇到一些任务难以厘清,你们怎么办?

A:肯定会尽全力满足客户的需求,如果客户觉得应该这么做,我们尽量按照他们的方式去做适配,也会提供一些建议或参考,比如说我会告诉客户,这么用的话芯片效率可能会更高,当然,也会提供有Plan A、Plan B等多个版本供客户选择。




推荐阅读



又一新造车赴美上市!估值千亿超蔚来
马斯克疯狂画饼!新车年销500万

评论 (0)
  • 这款无线入耳式蓝牙耳机是长这个样子的,如下图。侧面特写,如下图。充电接口来个特写,用的是卡座卡在PCB板子上的,上下夹紧PCB的正负极,如下图。撬开耳机喇叭盖子,如下图。精致的喇叭(HY),如下图。喇叭是由电学产生声学的,具体结构如下图。电池包(AFS 451012  21 12),用黄色耐高温胶带进行包裹(安规需求),加强隔离绝缘的,如下图。451012是电池包的型号,聚合物锂电池+3.7V 35mAh,详细如下图。电路板是怎么拿出来的呢,剪断喇叭和电池包的连接线,底部抽出PCB板子
    liweicheng 2025-05-06 22:58 345浏览
  • 2024年初,OpenAI公布的Sora AI视频生成模型,震撼了国产大模型行业。随后国产厂商集体发力视频大模型,快手发布视频生成大模型可灵,字节跳动发布豆包视频生成模型,正式打响了国内AI视频生成领域第一枪。众多企业匆忙入局,只为在这片新兴市场中抢占先机,却往往忽视了技术成熟度与应用规范的打磨。以社交平台上泛滥的 AI 伪造视频为例,全红婵家人被恶意仿冒博流量卖货,明星们也纷纷中招,刘晓庆、张馨予等均曾反馈有人在视频号上通过AI生成视频假冒她。这些伪造视频不仅严重侵犯他人权
    用户1742991715177 2025-05-05 23:08 85浏览
  • 二位半 5线数码管的驱动方法这个2位半的7段数码管只用5个管脚驱动。如果用常规的7段+共阳/阴则需要用10个管脚。如果把每个段看成独立的灯。5个管脚来点亮,任选其中一个作为COM端时,另外4条线可以单独各控制一个灯。所以实际上最多能驱动5*4 = 20个段。但是这里会有一个小问题。如果想点亮B1,可以让第3条线(P3)置高,P4 置低,其它阳极连P3的灯对应阴极P2 P1都应置高,此时会发现C1也会点亮。实际操作时,可以把COM端线P3设置为PP输出,其它线为OD输出。就可以单独控制了。实际的驱
    southcreek 2025-05-07 15:06 226浏览
  • 文/郭楚妤编辑/cc孙聪颖‍相较于一众措辞谨慎、毫无掌舵者个人风格的上市公司财报,利亚德的财报显得尤为另类。利亚德光电集团成立于1995年,是一家以LED显示、液晶显示产品设计、生产、销售及服务为主业的高新技术企业。自2016年年报起,无论业绩优劣,董事长李军每年都会在财报末尾附上一首七言打油诗,抒发其对公司当年业绩的感悟。从“三年翻番顺大势”“智能显示我第一”“披荆斩棘幸从容”等词句中,不难窥见李军的雄心壮志。2012年,利亚德(300296.SZ)在深交所创业板上市。成立以来,该公司在细分领
    华尔街科技眼 2025-05-07 19:25 167浏览
  • 后摄像头是长这个样子,如下图。5孔(D-,D+,5V,12V,GND),说的是连接线的个数,如下图。4LED,+12V驱动4颗LED灯珠,给摄像头补光用的,如下图。打开后盖,发现里面有透明白胶(防水)和白色硬胶(固定),用合适的工具,清理其中的胶状物。BOT层,AN3860,Panasonic Semiconductor (松下电器)制造的,Cylinder Motor Driver IC for Video Camera,如下图。TOP层,感光芯片和广角聚焦镜头组合,如下图。感光芯片,看着是玻
    liweicheng 2025-05-07 23:55 103浏览
  • 随着智能驾驶时代到来,汽车正转变为移动计算平台。车载AI技术对存储器提出新挑战:既要高性能,又需低功耗和车规级可靠性。贞光科技代理的紫光国芯车规级LPDDR4存储器,以其卓越性能成为国产芯片产业链中的关键一环,为智能汽车提供坚实的"记忆力"支持。作为官方授权代理商,贞光科技通过专业技术团队和完善供应链,让这款国产存储器更好地服务国内汽车厂商。本文将探讨车载AI算力需求现状及贞光科技如何通过紫光国芯LPDDR4产品满足市场需求。 车载AI算力需求激增的背景与挑战智能驾驶推动算力需求爆发式
    贞光科技 2025-05-07 16:54 147浏览
  • 多功能电锅长什么样子,主视图如下图所示。侧视图如下图所示。型号JZ-18A,额定功率600W,额定电压220V,产自潮州市潮安区彩塘镇精致电子配件厂,铭牌如下图所示。有两颗螺丝固定底盖,找到合适的工具,拆开底盖如下图所示。可见和大部分市场的加热锅一样的工作原理,手绘原理图,根据原理图进一步理解和分析。F1为保险,250V/10A,185℃,CPGXLD 250V10A TF185℃ RY 是一款温度保险丝,额定电压是250V,额定电流是10A,动作温度是185℃。CPGXLD是温度保险丝电器元件
    liweicheng 2025-05-05 18:36 273浏览
  • ‌一、高斯计的正确选择‌1、‌明确测量需求‌‌磁场类型‌:区分直流或交流磁场,选择对应仪器(如交流高斯计需支持交变磁场测量)。‌量程范围‌:根据被测磁场强度选择覆盖范围,例如地球磁场(0.3–0.5 G)或工业磁体(数百至数千高斯)。‌精度与分辨率‌:高精度场景(如科研)需选择误差低于1%的仪器,分辨率需匹配微小磁场变化检测需求。2、‌仪器类型选择‌‌手持式‌:便携性强,适合现场快速检测;‌台式‌:精度更高,适用于实验室或工业环境。‌探头类型‌:‌横向/轴向探头‌:根据磁场方向选择,轴向探头适合
    锦正茂科技 2025-05-06 11:36 390浏览
  • Matter协议是一个由Amazon Alexa、Apple HomeKit、Google Home和Samsung SmartThings等全球科技巨头与CSA联盟共同制定的开放性标准,它就像一份“共生契约”,能让原本相互独立的家居生态在应用层上握手共存,同时它并非另起炉灶,而是以IP(互联网协议)为基础框架,将不同通信协议下的家居设备统一到同一套“语义规则”之下。作为应用层上的互通标准,Matter协议正在重新定义智能家居行业的运行逻辑,它不仅能向下屏蔽家居设备制造商的生态和系统,让设备、平
    华普微HOPERF 2025-05-08 11:40 90浏览
  • UNISOC Miracle Gaming奇迹手游引擎亮点:• 高帧稳帧:支持《王者荣耀》等主流手游90帧高画质模式,连续丢帧率最高降低85%;• 丝滑操控:游戏冷启动速度提升50%,《和平精英》开镜开枪操作延迟降低80%;• 极速网络:专属游戏网络引擎,使《王者荣耀》平均延迟降低80%;• 智感语音:与腾讯GVoice联合,弱网环境仍能保持清晰通话;• 超高画质:游戏画质增强、超级HDR画质、游戏超分技术,优化游戏视效。全球手游市场规模日益壮大,游戏玩家对极致体验的追求愈发苛刻。紫光展锐全新U
    紫光展锐 2025-05-07 17:07 196浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦