特斯拉的AI day总是那么的吸引人,为什么呢?首先特斯拉总会带给人们耳目一新的东西,也就是我们稀罕的创新,他开启了电动车量产时代,他用AI智能驾驶吸引并激发人们的AI人工智能热情。另一个方面,在互联网时代,我们总热衷于Copy to China的模式,当前互联网大批巨头都是诞生于那个模式;其实智能汽车时代我们似乎还在这个圈中,例如我在《浅谈高阶智能驾驶-领航辅助的技术与发展》中讲到新势力的领航辅助从功能到交互的模式和图形都能找到特斯拉的影子。
所以特斯拉的AI day总是那么让人关心,他或许能给我方向的引领,技术的启发,当然我们也能从他身上学到经验教训。中国有着巨大的人口和快速发展,敢于尝鲜的市场,从特斯拉身上掘取的启发能够在中国市场快速获取成功。
其实特斯拉底层关注的两个板块是能源和人工智能。从人类个体角度上看,一个是驱动是劳力,另外一个驱动是智慧也就是脑力;从社会属性上来看,一个是能源,另外一个是人才。有这两个要素,那么你就是把任何东西扔到火星上也能创造出新世界,这或许就是马斯克一直在构建火箭登陆火星的理想的前提要素吧。但如果单从现在特斯拉的智能驾驶和新能源角度来看,显然特斯拉要走的路还很长很长,从人工智能长远来看,还处于婴幼儿阶段。那么此次特斯拉的AI day 讲了什么呢?他的机器人,智能驾驶和超算中心到了哪个阶段?他的设计理念以及技术的关注点有哪些?让我通过AI day现场视频来解读和推测,当然解读特斯拉的技术相关信息是一个烧脑的过程,也是自我学习的过程,所以有错误和偏颇还请留言指正一起学习。不过显然,单单一个主题的信息量都是足够大,所以我将按照他三个主题分三部分最少三篇文章来分析,此次特斯拉AI day首先讲到的是AI机器人。其实在秀特斯拉的现场的AI机器人的时候,特别是机器在支架上秀动作,被搬上搬下台的时候,马斯克微表情透露出其实内心应该是觉得有点尴尬,这个时候的机器人从智能上看可能还远不及婴幼儿那么自然,也离真实上市应用预期相差甚远。当然在这期AI day上马斯克脸上透露更多的是另外两个微表情,一个是深邃的望着远方,另外一个低头眼神坚毅的沉思。这两个眼神传达出马斯克相信机器人会改变世界,造福文明,并且表示特斯拉机器人的售价会低于2万美金,计划销量差过百万台,最后马斯克广告招募人才,希望更多人才加入来实现这个目标和远景。
特斯拉机器人的项目概念是在去年2021年的AI day上推出,那次会议上马斯克是用一个真实的人穿着概念衣服,把大家戏弄了一番,但在今年2月份其实特斯拉就已经开发出了其机器人平台,然后最新一代就是今天现场秀出的。特斯拉表示其实目前实验室内特斯拉的机器人,可以做到搬运箱子,抓取移动物体,浇水等动作,当然我看了网上传的非常疯狂的一个视频,这个视频把特斯拉机器人所有动作都放快了,所以看了那个视频,你真的相信这个机器人明天就可以飞入普通百姓家,可用了。但其实通过直播看到这都是样机的测试,第一非常慢,第二样机还无法脱离头部的电源或者控制线路,显然虽然进步非常大但真的实用还有待时日,毕竟在回答什么时候消费者能买到的问题的时候,马斯克回答应该是3年左右不会超过5年。对于机器人的语音能力此次没有展示,但是在问答环节,马斯克表示肯定会有自然语言对话能力,当然语音对话目前对于AI 人工智能来讲不是多大难题,但到自然语言还有不少距离。所以让我们先看看特斯拉机器人开发过程当中的技术相关问题,特斯拉表示,其机器人的开发参考了特斯拉现有的汽车开发流程,先构建了类似于汽车平台架构的开发平台,再进行软硬件的开发集成。特斯拉机器人开发是一个仿生的过程,这个仿生的对象是人,所以特斯拉先从研究人开始,例如一个73公斤的人,一个坐下的动作消耗能量大概100w,健步走大概500w的能量,整个人体的运动自由度超过200+个,手大概27个。但汽车动态性能开发中悬架才4个自由度,所以机器人复杂程度不言而喻,所以特斯拉首先根据人类特征构建一个73公斤左右的机器人平台。特斯拉基于仿生构建机器人平台之后,再依据量产的成本,能耗效率,规模化等需求贯穿机器人开发设计流程,例如减少运动部件中的零部件,来减重降能耗达到高效。能源动力电池方面,动力电池的开发中央化,一块2.3kWh,52V 锂电池布置在机器人胸部,能量规划支撑机器人两天的运行,一块PCB板支持所有电池通讯以及充放电管理。计算处理方面,中央控制器,就前几天和一个域控制器厂商朋友聊天,我们畅想汽车域控制器的应用未来就是直接和机器人共用,显然特斯拉就这么干了,特斯拉机器人采用和特斯拉汽车上一样的中央处理器,配上网联设备,声音系统,以及电子安全等组成机器人大脑。执行架构方面,整机共28个执行机构,按照下文说法每个手6个,那么猜想腿部3个,手臂5个这样的执行器布局,其中机器人的手支持11个自由度。
整机结构方面,特斯拉在AI day上广告了一遍其车身碰撞安全的仿真能力,讲实话这项仿真能力在老牌主机厂眼中都是非常成熟的东西。特斯拉表示这种仿真能力一样可以移植到机器人的开发当中,从碰撞损伤到结构耐久再到运动仿真执行机构的能耗最怕的不稳定的输出,但是人类的腿部运动就是一个不稳定的输出,如果按照正常的设计那么电机的力输出就是非线性,非线性就会导致能量骤增骤减那么能量就会浪费掉。最后特斯拉通过设计4个支点的关节设计让运动情况下电机的输出是平顺的从而保证能效性。
对于动力传动系统电机执行器的设计,同样特斯拉利用汽车设计的理论和经验,对于电机的设计,同样是在能量,重量,成本之间最优的调和。汽车开发对于电机的设计开始都是基于工作的工况设计,例如主要考虑各个速度区间,城市,高速等等一系列工况。而对于机器人显然其工况极其复杂而且多样化。
但开发设计流程和汽车设计类似,特斯拉首先基于机器人平台和原型收集电机各个工况下的扭矩以及速度的关系,寻找到最常用以及最优的区间,但是如上文所讲特斯拉机器人有28个关节执行器。那么如果按照每个关节执行器电机的最优点来设计那么就要设计28个不同的关节执行器电机。显然这样从制造和维护来讲都是不经济的,这个和我之前文章《整车架构平台核心-大道至简(Complexity Reduction)五步骤》讲平台架构类似,变种越少越利于批量,越利于成本和质量控制。所以特斯拉根据大数据匹配决定28个关节执行器,共使用3种驱动电机,匹配三种执行器(其实通过上图三种不同颜色,可以推测出三种电机的位置),执行器机械采用应变波齿轮(也称为谐波齿轮)传动,其中最大的电机2.26kg,最大的执行器2.2kg 可以产生最高达8000N的拉力,并且设计时候考虑耐久等因素。特斯拉AI day上演示了其执行器拉动重达半吨的钢琴。对于最复杂的机器人手的设计,特斯拉采用了6个执行器,实现手的11个自由度控制,来实现适应性的抓取,不可以反向驱动的手指也就是自锁,可以提9公斤左右的袋子,使用工具,对于细小物品的精准抓取。有了机器人的能量机构,执行机构之后,就是考虑机器人的人工智能控制了,自动驾驶经典的三步骤,感知,规划,执行,在机器人身上同样适用。
关于传感器,根据特斯拉汽车的原理,特斯拉机器人也主要利用视觉来作为环境感知传感器,根据视频发布,特斯拉机器人采用3个摄像头,应该都布置在头部,一个前部鱼眼摄像头,左右应该各一个视觉摄像头,通过这样的视角布置基本模拟人类视角范围,但这个视角范围应该超过180度。视觉采用的算法是和特斯拉汽车一样的occupancy network 算法,这个在下一篇文章会仔细讲到,简单的说法就是视觉识别当前障碍物,来确定活动空间。但特斯拉表示虽然算法底层一样但是由于汽车的运动空间和机器人室内环境完全不一样,所以特斯拉机器人要对其算法重新训练。
有了活动空间,那么接下来就是导航,路径规划,例如机器人自己找到充电口,其实机器人导航比汽车导航就更难了,毕竟汽车导航还有GPS或者更精准的高精地图,而机器人不太可能有。特斯拉机器人采用兴趣点提取的方法,在视频流中逐帧跟踪高频兴趣点,和关键点,来识别所在位置直到目标地识别,这种算法目前还是比较高级也还在完善中。
最后就是动作规划执行,行走了,行走对于人类来讲太容易了,但是对于机器人这是一个巨大的挑战,他牵扯到机器人的自我意识,能耗最优的步调,整机的平衡,动作的协调。机器人首先根据感知的环境规划出期望的路径,再计算出脚步,产生运动行走轨迹路线,当然转化到机器人上面是各个执行器的扭矩速度输出。显然规划的时候是把环境看起来是完美的,机器人也是简化的,所以看起来容易,但现实世界控制确是异常的复杂,例如传感器的噪声,机器人的协调等等,所以特斯拉机器人对机器人的高度信息以及质心进行跟踪用来判断机器人的状态,来实现稳定,但是行走,却还关系整机的协调,这个时候就需要整机其他执行机构例如手臂等一起联动了。
对于整机姿态的联动,特斯拉采取的方法是,先采集人类各种姿势运动的自然联动参考,输入给机器人,机器人再根据现实情况进行调整,最后输出给机器人控制。以上就为特斯拉机器人当前已经考虑和解决和正在解决的问题,所以机器人的自动工作原理和智能汽车一样,环境感知,路径规划,动作规划以及执行。下一步特斯拉机器人会更加专注于现实应用场景的解决和测试,例如工厂工作。另外还有很多技术问题亟需解决例如上文介绍的机器人室内导航,运动优雅的管理等。最后在问答环节,有人问特斯拉机器人的能力带宽,其中指出关于机器人的能力的敏捷性,他的指标之一是运动频率,显然这个问题很难,貌似没有回答出来,马斯克说1hz 或者10hz甚至可能100hz。这个问题确实很专业,机器人的运动频率最后决定他多敏捷。马斯克的勇气是异常可嘉的,他走的路径是基于人的仿生通用机器人,按照他的说法是会改变文明,改变经济结构。这条路还是会很远可能按照十年来计算的单位,但是未来仿生服务机器人,陪伴机器人可能不会太远,有可能五年左右会出现在我们的身边。
其实机器人并不是一个全新的东西,几十年前工业时代的欧美,和90年代日本都有过类似的仿生机器人热,但其实都难以满足真实场景需求,而大批量推广。那么此刻在新能源以及人工智能技术的发展铺垫下,仿生机器人是不是有大发展呢?
加入我们的知识星球Vehicle 可以下载公众号海量参考资料包含以上参考资料。。- 2000TOPs的英伟达和高通要把智能汽车带向何方?
- 从大众新CEO的十个工作重点看大众汽车电气化,软件定义汽车的方向和方法
- 芯片和操作系统 - 当前汽车供应链面临的关键问题思考