抢跑智驾AI芯片「新路径」

原创 高工智能汽车 2023-05-14 11:39

“胆量”这个词,被后摩智能创始人兼CEO吴强着重提及。

5月10日,后摩智能发布首款存算一体智驾芯片鸿途™H30,以12nm制程实现最高物理算力 256TOPS,典型功耗 35W,成为国内率先落地存算一体大算力 AI 芯片的公司。即,能效比大幅拉升至7.3TOPS/W,根据高工智能汽车之前系统梳理,业内智驾大算力芯片采用冯诺依曼架构,能效比多在2-4TOPS/W。

事实上,自1945年6月,冯·诺依曼写出那份著名的长达101页的文档《First Draft of a Report on the EDVAC》,详细阐述“存储程序计算机(Stored-program Computer)”,不久后第一台冯·诺依曼架构计算机诞生,截至目前70多年间,主流的计算范式始终遵循这一架构。

根据资深芯片专家陈巍博士、耿云川博士此前文章阐述,冯式架构以计算为核心,计算与存储分离,两者配合完成数据的存取和计算,处理器以提升计算速度为主,存储注重容量提升和成本优化。但在过去20年,处理器性能以每年大约55%的速度提升,内存性能的提升速度每年只有10%左右,存储速度严重滞后于处理器的计算速度。

详细来看,自动驾驶、元宇宙、大模型等强烈呼唤更大算力、更高能效时代。但,冯式架构下,由于存储器和处理器的数据交换通路窄,AI运算需1PB/s,但DRAM 为40GB-1TB/s,数据提取、搬运时间为运算时间的成百上千倍,无用功耗约为60-90%,即存储墙、带宽墙、功耗墙问题越来越严重。

存算一体的概念提出于1969年,为非冯氏架构,其直接利用存储器进行数据处理或计算,从而把数据存储与计算融合在同一个芯片的同一片区之中,可以彻底消除冯氏架构架构瓶颈,“数量级程度降低功耗、一定程度提升算力(计算能力仍受制程制约)”。

受限于芯片制造技术和算力需求的匮乏,存算一体一段时间内仅仅停留在理论研究阶段,近年来则再次在产业界走热,英伟达、英特尔、微软等纷纷推出系统原型。

吴强瞄准的,就是这样一个时代窗口。

“长远来看,我们想做的事情就是用一个极致效率的芯片去实现万物智能,这也是我们自己给自己的使命”,吴强在发布会上称,从早期计算机到PC时代,再到智能手机时代,都伴随着1000倍计算效率的提升。后摩智能显然欲借底层技术创新的存算一体,抢跑下一个时代。


推进节奏


在第一阶段,后摩智能聚焦的应用领域为智能驾驶。

底层技术和处理器架构层面,据后摩智能联合创始人兼研发副总裁陈亮介绍,存算IP层面,鸿途™H30基于 SRAM 存储介质,采用数字存算一体,拥有极低访存功耗和超高计算密度,在 Int8 数据精度条件下,其AI核心IPU能效比高达15Tops/W,是传统架构芯片的7 倍以上。

处理器架构层面,后摩智能规划了三代架构,第一代为天枢架构,面向智能驾驶打造;第二代为天璇架构(已在研发中),可根据应用场景的不同配置计算单元的数量,整体性能、效率和灵活性将进一步跃升,支持多场景应用,例如成本和功耗敏感的智能终端、自动驾驶、大模型等场景;第三代IPU面向通用人工智能打造,命名为天玑架构。

其中,鸿途™H30基于天枢架构,其采用多核、多硬件线程的方式扩展算力,实现了计算效率与算力灵活扩展的均衡,AI 计算可以在核内完成端到端处理,保证通用性。得益于此,鸿途™H30 实现了性能2倍提升的同时,降低50%功耗。

“它最大的特点就是计算效率特别高”,后摩智能联合创始人兼产品副总裁信晓旭称。

据信晓旭介绍,SOC层面,得益于存算一体底层架构创新优势,鸿途™H30 基于 12nm 工艺制程实现256TOPS物理算力,SoC能效比达到 7.3Tops/W,具有高计算效率、低计算延时、低工艺依赖等特点。

鸿途™H30 已成功运行常用的经典 CV 网络和多种自动驾驶先进网络,包括BEV 网络模型以及广泛应用于高阶辅助驾驶领域的 Pointpillar 网络模型,以鸿途™H30 打造的智能驾驶解决方案已经在合作伙伴的无人小车上完成部署。

据信晓旭释放的信息,鸿途™H30 将于2023年6月份开始给 Alpha 客户送测。同时,后摩智能的第二代产品鸿途™H50 已经在全力研发中,将于2024年推出,支持客户2025年的量产车型。

那么,鸿途™H30 瞄准具体什么样的市场?

根据高工智能此前调研获取的信息,当前智驾芯片呈分层发展趋势,其一,智能前视一体机;其二,5-20TOPS轻量级行泊一体;其三,50-200TOPS中算力平台,支撑增强版高速NOA;其四,200TOPS以上高算力平台,做硬件预置和算力冗余,传感器配激光雷达,支撑城市NOA。

显然,鸿途™H30更有可能面向第四个市场,这也意味着,其将英伟达的Orin形成正面对抗。整体来看,这一市场在2022年已开启规模放量元年,与城市NOA元年、激光雷达规模放量元年相对应。对此,信晓旭也强调,产品发布只是开始,接下来的落地中,后摩会针对不同车型和对成本的考量,推出更丰富的产品系列,以满足不同类型客户对性价比的需求。

在时间节奏上,虽然后摩智能未披露鸿途™H30的量产时间,不过根据送测到上车的时间周期,鸿途™H30最快或于2024年上车。

根据后摩智能披露的信息,“我们拜访了超过50家客户和合作伙伴(包括20+主机厂),与他们进行了多轮次的合作和交流,我们也一起探讨如何用存算一体的颠覆性的技术,解决现实方案中的痛点,让我们的产品定义和产品组合策略更清晰”。

值得一提的是,为助力客户产品落地,后摩智能基于鸿途™H30开发了硬件参考设计平台:力驭®智驾域控制器。

根据现场展示的信息,该平台功耗仅85W,以太接口方面,提供8路100/1000Base-T1、2路100/1000Base-TX接口,可接入激光雷达、TBOX、组合导航及调试,摄像头接口方面,提供12路GMSL2摄像头接口,支持raw data输入(支持2个800万摄像头、6个200万摄像头)。


如何规模落地?

欲戴皇冠,必承其重。

高工智能汽车注意到,一方面,作为智驾芯片初创企业,此前调研中,部分业内人士反馈的最大挑战为“完成商业化闭环”。换言之,没有厂商可以在一开始,就交出一个十全十美的“芯片+工具链”,只有抓住某一具体应用场景的市场窗口,先交一个相对优质的答卷,被客户用起来,有一定造血能力,接着再快速把芯片、工具链迭代好。

另一方面,根据业内的观点,存算一体从学术研究,走向产业落地,面临的挑战包括:电路设计影响芯片算效提升、芯片架构场景通用性及规模扩展能力较差、EDA工具链尚未健全、软件及算法生态不完善等。

后摩智能如何解决?

根据信晓旭的介绍,在商业模式上,“后摩智能会坚定把自己定位为汽车产业连的Tier2,我们坚持不跨界、不越位原则,要做好自己擅长的事,我们坚持会用我们的底层的核心技术,去打造有竞争力的智能驾驶计算芯片,并提供必要的组件”。

同时,后摩智能尝试搭打造Sailing平台(寓意助力合作伙伴扬帆起航)。

其包括三部分:其一,贴近芯片的使能组件部分,包括基于鸿途™系列芯片的硬件平台、Boot&Drivers、软件工具链后摩大道™;其二,包括第三方合作伙伴的底层OS、第三方合作伙伴的中间件、第三方合作伙伴的智驾算法;其三,提供Model zoo加快合作伙伴的算法开发进程。

软件工具链为核心关键之一。根据高工智能汽车此前调研获取的信息,芯片厂商的长期核心竞争力往往被聚焦为两个:芯片本身、主要包括工具链的生态。此次发布会上,信晓旭亦分享了其创业之前过往从业过程中的“教训”:因工具链难用导致已获得的项目被客户放弃。

“我们的竞争力要构建两个方面:一个是要基于存算一体架构打造更好的PPA,这是硬的东西;另外一个是软的东西,我们要把软件工具链当成产品的另外一个关键的竞争力来打造”,信晓旭称,这是公司团队在创业伊始就达成的共识。

据介绍,后摩大道™的设计哲学包括两个:大道至简、大道至臻。

前者强调相同:对于客户呈现的开发方式、用户使用习惯,保持不变或者是相近的,尽量降低算法开发者的学习成本;后者强调不同,“为了打造好用的工具链,我们做了很多底层的独特设计。工具链和底层架构是强相关的,好用的工具链需要底层硬件给予很好的支持”。

整体来看,后摩大道™支持 PyTorch、TensorFlow 、ONNX 等主流开源框架,编程兼容 CUDA 前端语法,同时支持 SIMD 和 SIMT 两种编程模型,兼顾运行效率和开发效率,以无侵入式的底层架构创新保障了通用性的同时,进一步实现了鸿途™H30 的高效、易用。

评论
  • 1,微软下载免费Visual Studio Code2,安装C/C++插件,如果无法直接点击下载, 可以选择手动install from VSIX:ms-vscode.cpptools-1.23.6@win32-x64.vsix3,安装C/C++编译器MniGW (MinGW在 Windows 环境下提供类似于 Unix/Linux 环境下的开发工具,使开发者能够轻松地在 Windows 上编写和编译 C、C++ 等程序.)4,C/C++插件扩展设置中添加Include Path 5,
    黎查 2025-02-28 14:39 151浏览
  • 在2024年的科技征程中,具身智能的发展已成为全球关注的焦点。从实验室到现实应用,这一领域正以前所未有的速度推进,改写着人类与机器的互动边界。这一年,我们见证了具身智能技术的突破与变革,它不仅落地各行各业,带来新的机遇,更在深刻影响着我们的生活方式和思维方式。随着相关技术的飞速发展,具身智能不再仅仅是一个技术概念,更像是一把神奇的钥匙。身后的众多行业,无论愿意与否,都像是被卷入一场伟大变革浪潮中的船只,注定要被这股汹涌的力量重塑航向。01为什么是具身智能?为什么在中国?最近,中国具身智能行业的进
    艾迈斯欧司朗 2025-02-28 15:45 243浏览
  •         近日,广电计量在聚焦离子束(FIB)领域编写的专业著作《聚焦离子束:失效分析》正式出版,填补了国内聚焦离子束领域实践性专业书籍的空白,为该领域的技术发展与知识传播提供了重要助力。         随着芯片技术不断发展,芯片的集成度越来越高,结构也日益复杂。这使得传统的失效分析方法面临巨大挑战。FIB技术的出现,为芯片失效分析带来了新的解决方案。它能够在纳米尺度上对芯片进行精确加工和分析。当芯
    广电计量 2025-02-28 09:15 141浏览
  •           近日受某专业机构邀请,参加了官方举办的《广东省科技创新条例》宣讲会。在与会之前,作为一名技术工作者一直认为技术的法例都是保密和侵权方面的,而潜意识中感觉法律有束缚创新工作的进行可能。通过一个上午学习新法,对广东省的科技创新有了新的认识。广东是改革的前沿阵地,是科技创新的沃土,企业是创新的主要个体。《广东省科技创新条例》是广东省为促进科技创新、推动高质量发展而制定的地方性法规,主要内容包括: 总则:明确立法目
    广州铁金刚 2025-02-28 10:14 111浏览
  • RGB灯光无法同步?细致的动态光效设定反而成为产品客诉来源!随着科技的进步和消费者需求变化,电脑接口设备单一功能性已无法满足市场需求,因此在产品上增加「动态光效」的形式便应运而生,藉此吸引消费者目光。这种RGB灯光效果,不仅能增强电脑周边产品的视觉吸引力,还能为用户提供个性化的体验,展现独特自我风格。如今,笔记本电脑、键盘、鼠标、鼠标垫、耳机、显示器等多种电脑接口设备多数已配备动态光效。这些设备的灯光效果会随着音乐节奏、游戏情节或使用者的设置而变化。想象一个画面,当一名游戏玩家,按下电源开关,整
    百佳泰测试实验室 2025-02-27 14:15 140浏览
  • 一、VSM的基本原理震动样品磁强计(Vibrating Sample Magnetometer,简称VSM)是一种灵敏且高效的磁性测量仪器。其基本工作原理是利用震动样品在探测线圈中引起的变化磁场来产生感应电压,这个感应电压与样品的磁矩成正比。因此,通过测量这个感应电压,我们就能够精确地确定样品的磁矩。在VSM中,被测量的样品通常被固定在一个震动头上,并以一定的频率和振幅震动。这种震动在探测线圈中引起了变化的磁通量,从而产生了一个交流电信号。这个信号的幅度和样品的磁矩有着直接的关系。因此,通过仔细
    锦正茂科技 2025-02-28 13:30 108浏览
  • 在物联网领域中,无线射频技术作为设备间通信的核心手段,已深度渗透工业自动化、智慧城市及智能家居等多元场景。然而,随着物联网设备接入规模的不断扩大,如何降低运维成本,提升通信数据的传输速度和响应时间,实现更广泛、更稳定的覆盖已成为当前亟待解决的系统性难题。SoC无线收发模块-RFM25A12在此背景下,华普微创新推出了一款高性能、远距离与高性价比的Sub-GHz无线SoC收发模块RFM25A12,旨在提升射频性能以满足行业中日益增长与复杂的设备互联需求。值得一提的是,RFM25A12还支持Wi-S
    华普微HOPERF 2025-02-28 09:06 166浏览
  • 美国加州CEC能效跟DOE能效有什么区别?CEC/DOE是什么关系?美国加州CEC能效跟DOE能效有什么区别?CEC/DOE是什么关系?‌美国加州CEC能效认证与美国DOE能效认证在多个方面存在显著差异‌。认证范围和适用地区‌CEC能效认证‌:仅适用于在加利福尼亚州销售的电器产品。CEC认证的范围包括制冷设备、房间空调、中央空调、便携式空调、加热器、热水器、游泳池加热器、卫浴配件、光源、应急灯具、交通信号模块、灯具、洗碗机、洗衣机、干衣机、烹饪器具、电机和压缩机、变压器、外置电源、消费类电子设备
    张工nx808593 2025-02-27 18:04 128浏览
  • 更多生命体征指标风靡的背后都只有一个原因:更多人将健康排在人生第一顺位!“AGEs,也就是晚期糖基化终末产物,英文名Advanced Glycation End-products,是存在于我们体内的一种代谢产物” 艾迈斯欧司朗亚太区健康监测高级市场经理王亚琴说道,“相信业内的朋友都会有关注,最近该指标的热度很高,它可以用来评估人的生活方式是否健康。”据悉,AGEs是可穿戴健康监测领域的一个“萌新”指标,近来备受关注。如果站在学术角度来理解它,那么AGEs是在非酶促条件下,蛋白质、氨基酸
    艾迈斯欧司朗 2025-02-27 14:50 426浏览
  • Matter 协议,原名 CHIP(Connected Home over IP),是由苹果、谷歌、亚马逊和三星等科技巨头联合ZigBee联盟(现连接标准联盟CSA)共同推出的一套基于IP协议的智能家居连接标准,旨在打破智能家居设备之间的 “语言障碍”,实现真正的互联互通。然而,目标与现实之间总有落差,前期阶段的Matter 协议由于设备支持类型有限、设备生态协同滞后以及设备通信协议割裂等原因,并未能彻底消除智能家居中的“设备孤岛”现象,但随着2025年的到来,这些现象都将得到完美的解决。近期,
    华普微HOPERF 2025-02-27 10:32 244浏览
  • 应用趋势与客户需求,AI PC的未来展望随着人工智能(AI)技术的日益成熟,AI PC(人工智能个人电脑)逐渐成为消费者和企业工作中的重要工具。这类产品集成了最新的AI处理器,如NPU、CPU和GPU,并具备许多智能化功能,为用户带来更高效且直观的操作体验。AI PC的目标是提升工作和日常生活的效率,通过深度学习与自然语言处理等技术,实现更流畅的多任务处理、实时翻译、语音助手、图像生成等功能,满足现代用户对生产力和娱乐的双重需求。随着各行各业对数字转型需求的增长,AI PC也开始在各个领域中显示
    百佳泰测试实验室 2025-02-27 14:08 267浏览
  • 请移步 gitee 仓库 https://gitee.com/Newcapec_cn/LiteOS-M_V5.0.2-Release_STM32F103_CubeMX/blob/main/Docs/%E5%9F%BA%E4%BA%8ESTM32F103RCT6%E7%A7%BB%E6%A4%8DLiteOS-M-V5.0.2-Release.md基于STM32F103RCT6移植LiteOS-M-V5.0.2-Release下载源码kernel_liteos_m: OpenHarmon
    逮到一只程序猿 2025-02-27 08:56 204浏览
  • 振动样品磁强计是一种用于测量材料磁性的精密仪器,广泛应用于科研、工业检测等领域。然而,其测量准确度会受到多种因素的影响,下面我们将逐一分析这些因素。一、温度因素温度是影响振动样品磁强计测量准确度的重要因素之一。随着温度的变化,材料的磁性也会发生变化,从而影响测量结果的准确性。因此,在进行磁性测量时,应确保恒温环境,以减少温度波动对测量结果的影响。二、样品制备样品的制备过程同样会影响振动样品磁强计的测量准确度。样品的形状、尺寸和表面处理等因素都会对测量结果产生影响。为了确保测量准确度,应严格按照规
    锦正茂科技 2025-02-28 14:05 155浏览
  • 构建巨量的驾驶场景时,测试ADAS和AD系统面临着巨大挑战,如传统的实验设计(Design of Experiments, DoE)方法难以有效覆盖识别驾驶边缘场景案例,但这些边缘案例恰恰是进一步提升自动驾驶系统性能的关键。一、传统解决方案:静态DoE标准的DoE方案旨在系统性地探索场景的参数空间,从而确保能够实现完全的测试覆盖范围。但在边缘案例,比如暴露在潜在安全风险的场景或是ADAS系统性能极限场景时,DoE方案通常会失效,让我们看一些常见的DoE方案:1、网格搜索法(Grid)实现原理:将
    康谋 2025-02-27 10:00 258浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦