端到端智驾半壁江山都来了!2025首场自动驾驶峰会全部嘉宾揭晓,还将拆解世界模型与VLM

Vehicle 2025-01-05 21:02

2025年1月14日,第四届全球自动驾驶峰会将在北京中关村国家自主创新示范区展示交易中心-会议中心举行。经过三年的发展,全球自动驾驶峰会已经成长为国内自动驾驶领域最具影响力、规模最大的产业峰会之一。 

 

本次峰会由智一科技旗下智猩猩、车东西共同发起,以“技术新周期 产业新征程”为主题,全方位呈现自动驾驶端到端新周期里的科研成果、技术探索、产品方案创新与未来趋势。   

 

峰会由主会场+分会场+展区组成,主会场将进行开幕式、端到端自动驾驶创新论坛和城市NOA专题论坛,分会场将进行自动驾驶视觉语言模型技术研讨会、自动驾驶世界模型技术研讨会。其中,分会场的两场技术研讨会为闭门会议,主要向持有峰会通票或贵宾票的用户开放。

已经迫不及待报名的朋友,可以先扫描下方二维码添加小助手报名啦!

         

 

来自近30家企业、高校与科研机构的嘉宾学者已确认参与主题演讲和圆桌Panel。接下来为大家一一介绍。更多信息可以点击文末「阅读原文」进入峰会官网了解。   

 

01、开幕式嘉宾阵容     

 

清华大学车辆与运载学院党委书记、人工智能学院教授、博导 李升波

理想汽车自动驾驶研发副总裁 郎咸朋

智加科技首席科学家 崔迪潇 

演讲主题:《走向更安全更智能的干线物流》

内容概要: 

 

干线物流面临着交通事故频发、人力短缺、运营成本高等痛点,利用自动驾驶技术赋能干线物流的降本增效是当前产业重点。作为全球领先的干线物流自动驾驶企业,智加拥有自研的L4级全无人自动驾驶全栈技术,并采用渐进式的自动驾驶商业化路线。

智加已率先实现了有人监督的“智加领航”系统的前装量产,并与物流领先企业荣庆、中通、安能等进行商业化合作,运营范围覆盖了中国主要经济贸易地区,在大规模真实物流线路运营中验证了“安全、省力、省油”的产品价值。

本次报告,将展示智加在L4级全无人自动驾驶技术研发和L2+高级别辅助驾驶量产产品的最新进展,分享在端到端自动驾驶上的前沿成果,并探讨如何加速走向L4级无人化场景。

元戎启行副总裁、技术合伙人 刘轩

极佳科技合伙人&副总裁 毛继明

演讲主题:生成式世界模型:引领自动驾驶和具身智能新时代

内容概要:

随着智能驾驶技术的快速发展,生成式世界模型已成为迈向新一代算法的核心支柱。这项技术不仅是推动智能驾驶能力实现的关键,更是破解当前数据瓶颈的核心解决方案。

本次主题演讲将深入探讨生成式世界模型的层次化设计,从低阶“呈现效果”延展至更高维度的信息建模,包括空间几何、物理规则、人因行为及宏观知识等多个维度,全面解析其技术演进路径。此外,演讲将重点阐明基于世界模型的多智能体联合学习如何作为智能驾驶与世界模型结合的最佳实践,推动智能系统的协同发展与高效应用。

同时,演讲将分享极佳科技在世界模型领域的前沿探索成果,结合行业发展趋势,展望未来技术突破的关键方向,与会者共同探讨生成式世界模型如何引领智能驾驶迈向新的技术巅峰。

辰韬资本执行总经理 刘煜冬

演讲主题:《端到端新范式下的智能驾驶产业投资思考》

内容概要:

辰韬资本在2024年6月发布了《端到端自动驾驶行业研究报告》,首次提出了端到端技术架构演进的四个阶段,并对行业发展的诸多问题进行了较为全面的分析和展望。本次演讲将对近半年来端到端技术发展的新进展做一个回顾;同时,从投资视角分析,端到端新范式加速落地带来的智能驾驶产业发展新机遇。

02、端到端自动驾驶创新论坛

嘉宾阵容

中科院自动化所副研究员 张启超    

演讲主题:《监督学习式端到端自动驾驶的进展与挑战》

内容概要:         

 

2024年,端到端自动驾驶是智驾行业的主战场,这一年国内智驾技术迅猛发展,部分公司已经完成了从智驾1.0向量产级端到端自动驾驶的快速切换,这其中数据基建工程带来的规模化效应(scaling law)为这一阶段性进展提供了强力支撑。

本次将从科研角度分享,监督学习范式下端到端自动驾驶的新进展及其面临的关键挑战,分享端到端自动驾驶scaling law的探索,并讨论针对目前面临的关键挑战一些值得进一步探索的研究方向。

零一汽车智能驾驶合伙人 王泮渠

演讲主题:《端到端+大模型: 加速新能源重卡智能化之路》

内容概要:

随着新能源乘用车的跨越式发展,商用车,尤其是重卡的电动化与智能化成为了研究热点。零一汽车通过正向设计的新能源重卡平台,打造可量产的高阶智能驾驶重卡,成果显著。在智驾软件侧,针对传统自动驾驶算法架构复杂,成本高昂,泛化性差,量产困难的问题,我们提出了基于端到端与多模态大模型的解决方案,做到了框架简易,成本优势,泛化性强,量产友好。ZSD方案在多个公开数据集中获得最优成果,并在CVPR2024端到端自动驾驶挑战赛中以单摄像头方案荣获亚军。此外,我们基于ZSD打造了真实,高效,全面,自动的闭环仿真平台,真正为端到端方案的上车落地构建了良好的验证体系。在整车侧,我们正向设计了“水滴”冗余线控底盘系统,做到了高可靠,全功能,高性能,全冗余,数字化。这套系统大大优化了线控响应速度,提高了无故障连续运营时间,并大幅降低了系统成本。我们认为,基于强泛化算法,可量产平台,快闭环场景三要素的开发模式是真正实现新能源重卡智能化的必由之路。  

 

昇启科技联合创始人兼CTO 刘敏俊

演讲主题:一站式端到端自动驾驶研发平台

演讲概要

随着智驾从高速向城市演进,复杂的驾驶场景使得“AI感知预测 + 规则型规控”方案的技术天花板问题越来越严重。Transformer + BEV + Occupancy的感知定位方案已逐步成为行业共识,但是决策、规划、控制等模块仍然严重依赖人工规则和在线优化,缺乏利用数据进行闭环迭代的能力,限制了智驾功能在城市道路的表现。为解决该问题,自动驾驶的技术路线正全面升级,端到端全神经网络化将成为必然趋势,信息传递依赖高维度特征向量,最大程度地减少了传感器到执行器之间的信息损失。以神经网络为载体的“端到端”自动驾驶规控方案,使得全栈模块具备利用数据闭环进行快速更新的能力,这为高级别自动驾驶的智能性提升提供一条全新的技术路径。昇启科技自主研发的千行平台,覆盖数据生成、模型训练、仿真测试以及模型部署等全栈功能,提供场景泛化、性能评估、数据挖掘、场景回放等开发工具,可实现大批量、自动化、高覆盖度的端到端自动驾驶模型训练。当前该平台累计生成训练样本超540亿,测试里程超2700万公里,已和多家企业在工控机和车规级芯片上完成了城市开放道路的实车测试验证,有望在短时间内实现全栈端到端自动驾驶的商业化落地。

朗歌科技副总经理、智驾地图事业部总经理 李战斌     

 

    

演讲主题:《智驾地图,端到端时代的先验知识与关键模态》

内容概要:

数据闭环重塑高阶智驾未来,朗歌科技新一代城高一体智驾地图,通过周天数据智能体系聚合海量众源智驾数据,全方位提升智驾体验。智驾地图的生成,从传统的基于规则的构建,走向多模态大模型生成。朗歌智驾地图产线在云端,构建建图系统1和系统2及仿真校验系统。系统1实现端到端生成智驾图层,系统2实现复杂场景领航引导信息生成,仿真校验系统实现数据场景化复盘及增量数据回传。作为先验知识输入,智驾地图能够增强模型的道路感知能力,提升端到端上限;在特殊道路规则及无保护动态博弈等复杂场景下则能提供安全支撑,保障路径规划下限。同时,领航信息生成,助力智驾更像老司机。朗歌智驾地图已搭载领克08 EM-P及领克07 EM-P量产,收获良好用户口碑。朗歌科技将继续深度服务汽车智能化,加速推动智驾进程,与更多合作伙伴一起,开启智能驾驶新时代。         

 

 03、城市NOA专题论坛

嘉宾阵容         

 

北汽研究总院智能网联中心专业总师 林大洋    

 

 

全道科技CTO 刘斌

演讲主题:《从1到10:新生态数据闭环重塑高阶智驾》

内容概要:

以端到端为代表的城市NOA方案,是2024年“全国都能开”的终点,但却是今后“全国都好用”的起点,冰山下的数据闭环体系和冰山上的先验信息对“好用、爱用”来说同样重要,是端到端方案拓展上限和提升下限的重要路径。

上海昱感微电子科技有限公司创始人&CEO 蒋宏

演讲主题:《“多维像素”多模态雷视融合技术构建自动驾驶超级感知能力》

内容概要:         

 

昱感微采用最前沿的多维像素多模态融合技术,将可见光摄像头、红外摄像头、4D毫米波雷达/激光雷达的探测数据在前端(数据获取时)融合,并将各传感器的探测数据“坐标统一、时序对齐”,最后以“多维像素”的数据格式输出;昱感微的核心技术创新——“多维像素”,它是指在可见光摄像头像素信息上加上其它传感器对于同源目标感知的信息:即图像数据+雷达探测目标的距离、速度、散射截面R的感知数据+红外传感器探测的热辐射图像数据叠加组合到一起,以摄像头的像素为颗粒度组合全部感知数据,每个像素不仅有视觉信息,还包含了雷达和红外传感器的探测数据,形成“多维像素”多模态融合感知数据组合。公司的“多维像素”多模态感知技术,可以为AI系统提供更加直接、高效、可扩展的环境与事件感知能力,能够有效助力目前的AI人工智能从目前的“计算智能”阶段(高效快速处理海量数据)升级到“感知智能”(多维度高效获取物理事件信息)然后再向“认知智能”(机器能够主动思考并采取行动)质变的演进。         

 

昱感微第一代多维像素多模态感知产品(超级摄像头)将可见光摄像头、雷达以及红外摄像头数据融合,在高分辨率宽动态的可见光摄像头感知基础上,雷达提供目标的距离、速度维度的精准感知可以帮助可见光摄像头克服天气光线的影响,摄像头的图像又为雷达增添了语义信息,进一步提高雷达点云的置信度以及感知信息量;远红外摄像头有针对性的目标热辐射图像感知则赋予了自动驾驶系统卓越的夜视能力。昱感微“多维像素”超级摄像头就像是一双比人眼更敏锐的眼睛,看到的不仅仅是一幅幅二维的图像,还有更多维度的精确信息(目标的距离/速度/3D空间位置/温度/材质等),形成完整的多模态“视觉语言”,令自动驾驶系统可以精确全面地感知道路上各种状况。基于技术创新的融合感知技术,我们为国内外客户的AI系统(智能驾驶、机器人等产品)赋能更加直接、高效、可扩展的环境与目标事件感知能力。    

黑芝麻智能产品管理总监 周勇

      

 

 04、自动驾驶视觉语言模型技术研讨会

嘉宾阵容         

 

上海人工智能实验室  司马崇昊

华中科技大学Hust Vision Lab与地平线联合培养博士生 蒋博    

演讲主题:《地平线在端到端/VLM/VLA的探索与思考》

内容概要: 

 

端到端目前十分火热,地平线是最早一批探索和应用端到端算法的企业。在本次分享中,我将介绍我们在端到端方面的最新技术探索,包括首次提出多模态概率建模的VADv2,以及我们最近提出的基于扩散模型的端到端策略DiffusionDrive;另外,我还会介绍我们最近公开的VLM+端到端的大模型Senna,分享我们对于自驾VLM/VLA未来方向的一些看法和思考。 

中国科学院自动化研究所多模态人工智能系统全国重点实验室助理研究员 戴星原     

 

香港中文大学MMLab在读博士 邵昊    

 05、自动驾驶世界模型技术研讨会

嘉宾阵容

西湖大学工学院博导、助理教授、人工智能企业 KMind 联创兼首席科学家 于开丞

   

 

报告主题:《通向自主数据闭环的自动驾驶世界模型构建》

内容概要:

在自动驾驶领域,利用世界模型合成新数据已成为解决数据稀缺问题的事实标准。本报告将首先概述自动驾驶数据世界模型的最新行业进展。随后,我们将介绍自主智能实验室在构建基于世界模型的数据闭环方面的研究成果。最后,报告将探讨未来世界模型如何进一步助力实现更加自主的数据闭环系统。       

商汤绝影智能驾驶高级总监 武伟

报告主题:《「开悟」世界模型打造智驾「车云一体」数据闭环新范式》

内容概要:         

 

数据闭环一直是自动驾驶研发上的重要环节,以往基于高精度传感器的数据采集和基于量产车的数据闭环都存在不少问题,需要全新的解决方案。近年来,多模态大模型的技术突破带来了自动驾驶世界模型的快速发展。在本次研讨中,将介绍商汤绝影“开悟”世界模型以及其长时、高分辨率、多视一致、可控等特性的实现方式,展示绝影「车云一体」数据闭环新范式,也会探讨世界模型的下一步发展方向和应用前景。         

 

中国科学院计算技术研究所助理研究员 闵称   

 

 

报告主题:《从降低不确定性角度构建世界模型》     

 

内容概要:

智能体面临两种不确定性:认知不确定性和随机不确定性。认知不确定性源于信息或知识的不足,可以通过获取更多信息来减轻或解决;而随机不确定性则源于真实世界的随机性,例如对未来可能性的预测。随机不确定性无法完全消除,但可以通过评估不同结果的概率来应对。对于自动驾驶而言,理解并有效建模这两种不确定性对安全决策至关重要,因为驾驶过程中需要应对不完美的感知数据并准确预测未来场景。本报告将从降低不确定性的角度出发,构建能够同时建模认知和随机不确定性的世界模型,以提升自动驾驶系统的性能和可靠性。 

 

香港科技大学在读博士、上海AI Lab OpenDriveLab实习研究员 高深远  

 

    

      

 

报告主题:《构建开放场景中通用自动驾驶世界模型》

内容概要:   

 

世界模型是真实世界的模拟,可以预测不同行动对应的未来状态,并反馈给智能体的训练和决策过程。在自动驾驶领域,世界模型具有解决高效错误重放、合成数据生成以及增强决策鲁棒性等核心问题的巨大潜力,受到了学界和业界越来越广泛的关注。

本次分享将着重介绍GenAD和Vista系列工作,为构建可在开放场景中泛化的通用自动驾驶世界模型提供了一条可行的技术路线。相关工作已先后被CVPR 2024和NeurIPS 2024接收。  

 

上海交通大学计算机系2020级博士、上海人工智能实验室浦驾团队研究员 周云松         

 

     

 

    

报告主题:《基于仿真条件控制的自动驾驶世界模型》         

 

内容概要:

可控的合成数据生成可降低自动驾驶研发中训练数据的标注成本。在本工作中,我们提出了SimGen,它通过混合来自模拟器和真实世界的数据来学习生成多样化的驾驶场景。SimGen在保持基于文本和模拟器布局的可控性的同时,实现了卓越的生成质量和多样性,并作用于数据增强,危险场景生成,闭环评测等应用。

06、大会日程

07、报名方式     

 

峰会设置了三类电子门票,分别是免费票、通票和贵宾票。免费票申请需经组委会审核,通票、贵宾票均需购买。         

 

持免费票可参加主会场(开幕式、端到端自动驾驶创新论坛和城市NOA专题论坛)。持有通票或贵宾票,除了可参加主会场,还可参加两场闭门技术研讨会(自动驾驶视觉语言模型技术研讨会、自动驾驶世界模型技术研讨会)。详细权益,可通过文末左下角「阅读原文」,直达官网了解后,进行免费票申请或购票参会。

大家可以扫描下方二维码添加小助手“行远”申请免费票或购买门票。已添加过“行远”的老朋友,可以给“行远”私信,发送“自动驾驶”即可报名。         

 

  

Vehicle 不断奔跑才能应对变化,与汽车业内企业个人一起成长
评论
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 118浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 54浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 74浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 99浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 126浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 169浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 175浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 54浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 92浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 91浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 84浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 105浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦