华为天才少年"稚晖君”,智元机器人“远征A1”发布,有哪些看点?

原创 嵌入式电子 2023-08-19 09:50
惊艳亮相:
首先,远征A1缓缓驶入发布会现场,并和团队合影。


据介绍,智元远征 A1 的身高为 175 cm,体重为 55 kg,拥有 49+ 个自由度,具备人体关节的灵活性。
稚晖君讲述了现在AI和理想AI的差距:我们想让AI做的事,做饭、打扫房间、洗衣服、扔垃圾,AI实际在做的事,是聊天、绘画、写作、作曲、打游戏……

稚晖君介绍了几个月以来,团队在通用人形机器人本体和具身智能两方面分别取得的阶段性进展。





一、为什么做人形机器人

稚晖君表示,原因就在于「从第一性原理出发,人形双足机器人是人类环境中最为通用的终极形态!」

我们生活的物理世界中各种场景、设备、任务、工具,都是为人体形态量身打造的。

只有机器人像人,具备类似的身体结构和能力,才能够帮助机器人更好地融入人类的生活和工作环境,并且无需对机器人做任何改造。

如果机器人像人,它就可以做到人机交互、情感陪伴,甚至发挥在危险环境中替代人的巨大价值。

二、硬件设计
在远征A1本体硬件设计上,全身共有49+自由度,搭载了谐波一体关节、直线推杆、无刷行星伺服、空闲杯电机等驱各类执行器。

这些执行器就像人类关节一样,决定了人做各种动作的灵活性,机器人也是一样。

三、核心关节

对于人形机器人,最重要的是腿部的关节器,也就是电机。

在此,智元也实现了核心关节的自研——PowerFlow关节电机。

四、灵巧手


远征A1并不像人类一样,膝盖向前弯曲,而是采用了「反关节设计」。

稚晖君解释道,这款机器人设计的初衷,就是为了应用于各种真实的任务场景中。

因为现在的机器人关节自由度不够高,反关节的设计可以拥有更大的空间,更适用于干活。

五、模块化设计

除了本体的硬件参数,团队在整机的设计中,还包括了模块化设计的理念。

机器人不止是足式的,还可以是轮式的底盘,可以自由搭配不同形态,甚至未来还会有轮足款。

说到这里,稚晖君表示,知道大家非常关心哪吒的进展,稍后会给大家展示相关视频。

而且,除了上下身的组合,末端的灵巧手,也是支持自主更换的。

在某些场景下,它可能更适合各种专用的工具,比如螺丝刀、电钻。

总之,每个关键部件都能进行单独使用和搭配使用,合是一个机器人,分是无数个AI机械工具。

这就体现了通用性。


六、运控算法

有了优秀的硬件平台作为基础,再者,就是核心的运控算法。

在6个月的研发时间中,算法已经快速迭代了三版运控算法,从最初的IQP,到CMPC、线性NMPC,再到最近使用的非线性的NMPC。

以及,目前基于各种学习下开发的强化学习算法。

可以说,智元现在拥有业界一梯队算法研发能力。


同时,智元也在搭建离线轨迹优化平台。

国外顶级机器人团队,比如波士顿动力狗,能够实现跳舞、跑酷等一系列高难度动作。这对于智元来说,也不是高难度的问题。

稚晖君表示,与其他团队不同的是,实现这些能力之前,我们希望让机器人成本控制在20万以内,拥有真正落地可能。

所以,如何让通用机器人实现量产?还得回到最初所说的「具身智能技术」。

智元认为,硬件本体是前置条件,更重要的是背后机器人的「AI大脑」。

正是大语言模型技术的飞速发展,使得机器人能够自主感知环境、理解任务、动作编排等自主完成一套流程成为可能。

所以,稚晖君表示,「现在,我们不止需要ChatGPT,还需要WorkGPT。」

七、WorkGPT
我们知道,基于超大规模的数据预训练的语言和图像大模型,具备强大的语义理解、逻辑推理、图像识别、代码生成能力。

这些能力对于需要在真实物理世界中执行各种复杂任务的通用机器人,是非常重要的。


但是如何利用多模态大模型的能力,来赋能机器人的细微动作编排呢?这也是目前非常热点的研究方向。

下面的这个视频,在前一阵非常热门。

团队实现了自然语言端到端到机器人的映射,可以用自然语言让机器人编排整个任务,还能动态调整任务。


智元对于机器人和大模型结合的基本认知是,即语言和图像大模型对于机器人领域应用最大的价值:

首先是嵌入在大模型中,庞大的先验知识库&强大的通识理解能力。

比如,让机器人把桌上垃圾扔到垃圾桶里,不再需要告诉它垃圾是什么、垃圾桶是什么,所有的知识都是预训练GPT模型,具有先验知识。

所以,大模型的出现,能够让机器人更好地把原有的能力泛化到更通用的场景中。


第二点,就是大模型具有的复杂语义多级推理能力,也即所谓的「思维链」。

比如视频右边,需要让机器人对方块进行一系列操作。


让它把蓝色方块放到红色方块上面,非常简单。但如果让它把蓝色方块放到红色方块下面,就复杂了。

它需要理解重力是什么回事,东西不会飘在空中,怎样通过多级操作完成这个任务?这就是一个典型的多级推理思维链的过程。

稚晖君表示,随着大模型时代的到来,通过利用大模型的通识能力和举一反三的推理能力,我们可以看到走向通用机器人的一道曙光。

八、El Brain框架
机器人的El Brain框架可以分为云端超脑、大脑、小脑、脑干。

大脑提供AI辅助的抽象思维能力,如逻辑推理,思考能力,完成机器人任务级和技能级的调度。

比如规划任务「去看看门口是否有快递」,然后具体完成规划路径,开门关门,抓取释放物体等动作的调度。

如果端侧部署的模型泛化能力不够,还可再配合上云端超脑,在线解锁更复杂的任务调度能力。

小脑负责的是产生运动控制指令生成。

就如同人走路,大脑只发出宏观的指令,比如前进后退,需要小脑控制平衡,运动学动力学。

对于机器人来说,小脑主要是进行指令级的控制,设置上身姿态,控制指关节运动,控制头部姿态等。

脑干这一层级主要是解决底层的运动控制能力的问题。

比如,所有的电机的控制,电流环,速度环,位置环的控制。

在技能级这个模型层面,团队定义了一系列的语言操作,叫做Meta Skill。


Meta Skill的发展类似于智能驾驶中从L1到L5的整个过程,如果要实现全场景通用的机器人,也不可能是一步到位的过程。

在语言操作库限定的有限范围内,机器人可以实现自主的推理决策,完成端到端的任务编排。

随着语言操作能力库的不断扩充,机器人能够胜任的任务空间能够成指数级的增长。

在交互过程中不断成长,最终实现全场景任务覆盖。

九、商业落地
稚晖君表示,智元机器人不但是最酷的机器人,而且也会是最实用的机器人。

此外,团队一开始就是奔着商用落地去的,因此方向上主要瞄准工业制造领域,比如3C制造,汽车制造等等,快速推进产业化。

目前,已经和国内相关行业龙头企业进行了对接。


十、生态搭建

生态环境的搭建包括基础设施和开发者激励。

团队除了会向开发者提供整个机器人的开发套件、HDK、SDK外,还会提供基础预训练大模型,AgiROS仿生平台,以及低成本的教育版硬件,供开发者进行二次开发。

与此同时,还会开启一个智元远征启航的人才计划,吸纳人才。

十一、半年时间,从0到1

最后,稚晖君回顾了最近半年来,自己的心路历程。

2月底成立公司,项目立项、组建团队。

半年时间从0到1,实现了完整样机的研发流程。

稚晖君表示,如此之高的研发效,哪怕放在整个机器人行业里,也是相当炸裂的!

其中,在这半年的时间里,团队挑战了传统思维,打破了各种框架,尝试了许多前所未有的创新方案,每一步都是全新的探索。

下面这些图,记录着团队这半年过程中的点点滴滴。





发布会结束前,稚晖君向所有人分享了自己的个人感想:「人因梦想而伟大」。



他希望有一天,真正能够实现像科幻电影中智能的机器人。

这些机器人不再是简单的自主装置,而是拥有自我思考能力的智能伙伴,能够感知和理解我们的世界,与人类进行深入的沟通和合作。


而远征A1的发布,是智元追求卓越的起点,标志着在人工智能机器人领域迈出的重要一步。

谁是稚晖君
稚晖君,本名彭志辉
他在电子科技大学拿下本硕学位。不过本科时,他的专业是生物医学工程,因为一直自学计算机知识,研究生顺利转向信息与通信系统专业。


2018年毕业后,他的第一站是OPPO研究院,面试时一口气拿下硬件岗和算法岗的两个Offer。
但他最后选择了成为AI算法工程师。
2020年,稚晖君加入“华为天才少年计划”,加入华为计算产品线昇腾——这个部门主要是打造面向“端、边、云”的全场景AI基础设施方案。
华为给他的对外title是昇腾AI边缘计算专家。
加入华为的次年,任正非在演讲中表扬了他,称其是华为创新的动力
去年12月底,加入华为两年后,华为员工在线爆料华为内部已经搜不到稚晖君的工号,恐已离职。


随后,稚晖君正面回应:
传言不虚,细节不表,接下来我会开启一段新的事业,去做更有挑战的事情
2023年2月,其作为联合创始人之一智元机器人成立,他在其中担任CTO和首席架构师一角。
同为创始人的,还有上海人工智能研究院智慧康养首席科学家、上海交通大学机械与动力工程学院教授闫维新
他在康复机器人领域有所研究,并且研发中餐烹饪机器人有近16年历史,研发出60款以上餐饮服务类机器人。去年北京冬奥会纯·机器人炒菜、上菜的智慧餐厅,就由他主导参与。


说了那么多他的职业履历,但大家熟悉的稚晖君的身份,应该是B站科技区拥有近250万粉丝的知名UP主。
2021年,他曾拿下“年度百大UP主”称号。
据他自己说,最初只是把B站当做视频存储服务器,没想到却收获了一批稳定的粉丝,于是开始转型做up主。
不过半年,稚晖君火了,还因为过于硬核的视频内容被被网友们戏称为“野生钢铁侠”、“栈溢出”工程师。
其中最为出圈的几条,包括“钢铁侠机械臂”“自动驾驶自行车”“小电视”等,播放量都在300万+。


可以看到,他在B站上更新的内容大都和机器人相关
毕竟他曾经公开表示过对机器人领域的热爱,称最喜欢的还是智能交互和机电控制类的项目,说大点就是和机器人相关的
现在创业干的事儿,也聚焦在了机器人赛道,还是最近大热的具身智能。
今年4月时,稚晖君放出自制双足机器人哪吒的视频中就透露,在通用机器人和AI领域LLM结合上,今年晚些时候还会有一些动作。
上月底,更是放出了一段基于大模型的机器人行为自动编排和任务执行的视频:


这次发布会,B站直播间的粉丝们也打出了满屏的弹幕称赞。


如今不仅人形机器人新产品对外亮相,听闻公司层面进展也十分顺利,已经完成了天使轮、A轮、A1 轮、A1+轮共4轮融资。
从一个自称“野生钢铁侠”的B站up主,到成为N亿美元估值创业公司的CTO,真的做出了个“钢铁侠”,稚晖君花了3年的时间。
不瞒你说,就这位年轻人创业背后的更多故事,量子位特地和他聊了聊,也会整理出来与大家分享还帮大家催更了一下B站视频~
感兴趣的话不妨激情转发/在看,并关注接下来的更新


定期以通俗易懂的方式分享嵌入式知识,关注公众号,加星标,每天进步一点点。

声明:
本号原创、转载的文章、图片等版权归原作者所有,如有侵权,请联系删除。
关注、点赞、在看、转发,支持优质内容! 

评论
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 167浏览
  • 1月7日-10日,2025年国际消费电子产品展览会(CES 2025)盛大举行,广和通发布Fibocom AI Stack,赋智千行百业端侧应用。Fibocom AI Stack提供集高性能模组、AI工具链、高性能推理引擎、海量模型、支持与服务一体化的端侧AI解决方案,帮助智能设备快速实现AI能力商用。为适应不同端侧场景的应用,AI Stack具备海量端侧AI模型及行业端侧模型,基于不同等级算力的芯片平台或模组,Fibocom AI Stack可将TensorFlow、PyTorch、ONNX、
    物吾悟小通 2025-01-08 18:17 80浏览
  • 在过去十年中,自动驾驶和高级驾驶辅助系统(AD/ADAS)软件与硬件的快速发展对多传感器数据采集的设计需求提出了更高的要求。然而,目前仍缺乏能够高质量集成多传感器数据采集的解决方案。康谋ADTF正是应运而生,它提供了一个广受认可和广泛引用的软件框架,包含模块化的标准化应用程序和工具,旨在为ADAS功能的开发提供一站式体验。一、ADTF的关键之处!无论是奥迪、大众、宝马还是梅赛德斯-奔驰:他们都依赖我们不断发展的ADTF来开发智能驾驶辅助解决方案,直至实现自动驾驶的目标。从新功能的最初构思到批量生
    康谋 2025-01-09 10:04 88浏览
  • 一个真正的质量工程师(QE)必须将一件产品设计的“意图”与系统的可制造性、可服务性以及资源在现实中实现设计和产品的能力结合起来。所以,可以说,这确实是一种工程学科。我们常开玩笑说,质量工程师是工程领域里的「侦探」、「警察」或「律师」,守护神是"墨菲”,信奉的哲学就是「墨菲定律」。(注:墨菲定律是一种启发性原则,常被表述为:任何可能出错的事情最终都会出错。)做质量工程师的,有时会不受欢迎,也会被忽视,甚至可能遭遇主动或被动的阻碍,而一旦出了问题,责任往往就落在质量工程师的头上。虽然质量工程师并不负
    优思学院 2025-01-09 11:48 110浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 96浏览
  • 在当前人工智能(AI)与物联网(IoT)的快速发展趋势下,各行各业的数字转型与自动化进程正以惊人的速度持续进行。如今企业在设计与营运技术系统时所面临的挑战不仅是技术本身,更包含硬件设施、第三方软件及配件等复杂的外部因素。然而这些系统往往讲究更精密的设计与高稳定性,哪怕是任何一个小小的问题,都可能对整体业务运作造成严重影响。 POS应用环境与客户需求以本次分享的客户个案为例,该客户是一家全球领先的信息技术服务与数字解决方案提供商,遭遇到一个由他们所开发的POS机(Point of Sal
    百佳泰测试实验室 2025-01-09 17:35 90浏览
  • 在智能网联汽车中,各种通信技术如2G/3G/4G/5G、GNSS(全球导航卫星系统)、V2X(车联网通信)等在行业内被广泛使用。这些技术让汽车能够实现紧急呼叫、在线娱乐、导航等多种功能。EMC测试就是为了确保在复杂电磁环境下,汽车的通信系统仍然可以正常工作,保护驾乘者的安全。参考《QCT-基于LTE-V2X直连通信的车载信息交互系统技术要求及试验方法-1》标准10.5电磁兼容试验方法,下面将会从整车功能层面为大家解读V2X整车电磁兼容试验的过程。测试过程揭秘1. 设备准备为了进行电磁兼容试验,技
    北汇信息 2025-01-09 11:24 93浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球中空长航时无人机产值达到9009百万美元,2024-2030年期间年复合增长率CAGR为8.0%。 环洋市场咨询机构出版了的【全球中空长航时无人机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球中空长航时无人机总体规模,包括产量、产值、消费量、主要生产地区、主要生产商及市场份额,同时分析中空长航时无人机市场主要驱动因素、阻碍因素、市场机遇、挑战、新产品发布等。报告从中空长航时
    GIRtina 2025-01-09 10:35 91浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 88浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 131浏览
  • HDMI 2.2 规格将至,开启视听新境界2025年1月6日,HDMI Forum, Inc. 宣布即将发布HDMI规范2.2版本。新HDMI规范为规模庞大的 HDMI 生态系统带来更多选择,为创建、分发和体验理想的终端用户效果提供更先进的解决方案。新技术为电视、电影和游戏工作室等内容制作商在当前和未来提供更高质量的选择,同时实现多种分发平台。96Gbps的更高带宽和新一代 HDMI 固定比率速率传输(Fixed Rate Link)技术为各种设备应用提供更优质的音频和视频。终端用户显示器能以最
    百佳泰测试实验室 2025-01-09 17:33 101浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 112浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2025-01-09 09:58 77浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 113浏览
  • 职场是人生的重要战场,既是谋生之地,也是实现个人价值的平台。然而,有些思维方式却会悄无声息地拖住你的后腿,让你原地踏步甚至退步。今天,我们就来聊聊职场中最忌讳的五种思维方式,看看自己有没有中招。1. 固步自封的思维在职场中,最可怕的事情莫过于自满于现状,拒绝学习和改变。世界在不断变化,行业的趋势、技术的革新都在要求我们与时俱进。如果你总觉得自己的方法最优,或者害怕尝试新事物,那就很容易被淘汰。与其等待机会找上门,不如主动出击,保持学习和探索的心态。加入优思学院,可以帮助你快速提升自己,与行业前沿
    优思学院 2025-01-09 15:48 87浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦