更强感知与更低功耗:MakeSens深耕手势识别技术与算法

MEMS 2023-06-03 00:01

“AR/VR/XR×元宇宙”时代的到来

虚拟现实技术VR通过逼真的、具有三维视、触、嗅、听等多感官体验的虚拟世界,营造出如身临其境的虚拟世界。

增强现实技术AR将文字、图像、三维模型、音视频等数字信息,通过显示终端融入到现实世界,对现实世界信息不断加以完善和增强。

混合现实技术XR融合了VR和AR技术与场景,通过更为多元的场景建构,搭建起现实世界、虚拟世界以及用户之间实时、动态、可持续的交互与反馈,为用户创建出更为多元化的情景内容和空间体验。

从AR、VR到MR,构建虚拟世界与现实世界融合的各项技术以“XR”被统称为扩展现实技术,并以沉浸式的交互模式、大胆的创新正在逐步改变着世界存在的形式。“十四五”规划已明确将虚拟现实和增强现实列为数字经济重点产业之一。

而元宇宙概念的提出彻底撕开了现实与虚拟世界间的面纱。“元宇宙”集成了扩展现实、脑机接口、区块链、云计算、数字孪生、人工智能等多种技术,不再以技术为出发点,而是打破虚拟与现实的空间界限,以多元空间建构为基础,创新场景应用与交互,探索人类社会新的空间关系,并逐渐改变着人们对空间的认知。

当下,基于“AR/VR/XR”融合的多元场景,正越来越多的应用在人类工业生产、教育、医疗、娱乐、运营服务等领域。比如基于复杂工业设备的虚拟操控训练、课堂教学的沉浸式体验、医疗手术中的远程辅助、更具沉浸感的体验游戏、对历史场景的还原、服装购买过程中的衣物试穿等场景。未来,或许这些场景也将成为大元宇宙空间的重要内容。而社交元宇宙、企业元宇宙等概念的提出,也只是元宇宙创新的一种形式,更多的可能正在探索的路上。“AR/VR/XR×元宇宙”时代已经到来。

感知识别或将成为元宇宙空间时代人机交互主要入口与载体

在打破虚拟与现实世界界限的元宇宙空间里,手势、语音交互、脑机接口是最为直接的交互方式,或将成为下一代智能网络时代新的人机交互入口和载体。

在扩展现实技术营造的多元空间场景中,屏显设备建立起人与虚拟世界的视觉联系;座椅、脚踏设备等建立起与人的身体与虚拟世界的运动感知;味道、水汽等物理环境创设辅助人在虚拟空间的嗅觉感知和环境触觉感知;手势识别、语音识别、脑机接口等交互模式建立起人与虚拟世界的持续交互操控。

手势识别技术因其技术的成熟性,交互功能多样性,成为当下扩展现实感知交互发展的重要内容与设备。手势识别为身处元宇宙空间的人们提供了即时、高效、立体、多元和可持续的感观交互体验。手势识别技术在扩展现实场景操控与交互过程中发挥越来越重要的作用。

手势识别在沉浸式体验中不可或缺

人手本身属于人的操控器官,当人置身于虚拟世界中时,手眼协调是最自然的操控方式,且无需额外增加操控硬件。基于手势识别技术以及辅助增强手感知和反馈的可穿戴设备,手势识别可以帮助使用者建立起人手与虚拟世界场景间更为自然、真实的操控体验,比如在虚拟世界中拿起一杯水、变形一个物体、打开一扇门等等。

通过手势识别,可以更为直接的建立起手的动作感知与人脑间的自然连接,更为直接的联动人的视觉、触觉、听觉等感知体验,使人在虚拟情境中的感官体验变得更加立体、多元和真实,形成现实世界与虚拟世界间关联性更强的、更具沉浸感和交互性的体验效果,进而,可以创作出更加丰富、细腻、具有想象力的内容情境。

手势识别扩展现实情景交互场景

目前,手势识别技术存在裸手手势识别、触觉手柄、触觉手套、肌电手环等多种实现路径。其中,裸手手势识别通过基于摄像头的多点视觉识别技术分析和识别手的位置和姿态,搭载头显设备的裸手手势识别应用已经落地,并向更高精度发展;触觉手柄在操控手柄原有的定位与操控功能之外,通过震动、抓握等简单的交互方式增加触觉反馈;触觉手套通过搭载密集的执行器反馈点,在手势识别的准确性、流畅性、灵活度以及细微触觉感知等方面独具优势。

同时,在追踪定位方面,搭配摄像头+惯性测量单元的inside-out方案因能够实现三类平移、三类旋转的六自由度操作以及微动作、主体移动等功能,在消费级VR一体机上被广泛应用。

具有高感知的手势识别技术正逐渐走向成熟,推动手势识别应用的不断落地,为扩展现实情景内容交互的发展提供更多可能。

手势识别芯片技术逐渐走向成熟

在VR、AR、MR等扩展现实情景下,感知交互突破了二维屏幕的限制。裸手手势识别技术需要传感器、芯片和算法的协同工作。在传感器方面,需要识别精度更高、响应速度更快、覆盖范围更广,以及价格耕地和体积更小的传感器;在算法上,需要不断改进算法模型,提供更高精度的数据集;在芯片算力上,需要能够支撑更为复杂运算的芯片技术能力。

多角度成像手势识别芯片成为主流

手势识别最关键的技术是对手势动作的跟踪以及通过算法分析出手部的位置和姿态。根据硬件实现方式不同,手势识别芯片方案主要有三种:

一种是基于结构光原理,通过激光折射以及相应算法计算出物体的位置和深度信息,进而复原整个三维空间,代表产品是微软 KINECT一代,在深度计算和识别距离实现难度较大;一种是基于光飞时间原理,加载一个发光原件,通过CMOS传感器捕捉计算光子飞行时间推算物体的深度信息,代表产品是intel带手势识别功能的三维摄像头;一种是基于多角度成像原理,运用两个或多个摄像头同时采集图像,对比不同摄像头同一时刻获得的图像差别计算深度信息,形成三维图像,业内Leap Motion、MakeSens等公司使用的都是一个或多个普通摄像头组成的手势识别技术方案。

与深度摄像头方案相比,一个或多个普通摄像头实现的手势识别,在综合了实现成本、技术难度以及识别精度等要求下,未来或可成为头显设备主流的手势识别控制模式。

高感知手势识别的必要条件

基于多角度成像算法的手势识别系统,通过背景抠除、运动检测和阈值、轮廓提取等实现手部识别以及区分左右手;通过对单手的21个或26个关键点的动态、实时识别与追踪,确定手在图像中的位置以及识别手势所代表的信息;运用不同摄像头同一时刻获得的图像差别计算图像深度信息;进而,通过手势信息所代表的操作命令实现对界面内容的瞄准、选择和操控等操作。

为实现高感知手势识别,需要高质量的手势模型可以预测出更多的3D关节点;需要足够高精度的数据训练高质量的手势模型;需要基于深度学习的推理运算,则可以处理手的复杂动作,同时抵抗不同环境要素的干扰。因而,在高感知的实现过程中,需要更高效率的算力解决复杂问题,对芯片功耗、时延和成本也有着更高的要求。

与SLAM摄像头的兼容特性

在inside-out追踪成为主流的情况下,近两年,同步定位与建图SLAM技术在扩展现实场景上的应用不断增多。PC端VR头显、移动端VR一体机,AR眼镜等设备几乎全部加入了SLAM定位功能。SLAM摄像头大多采用鱼眼或是广角灰度摄像头,与RGB摄像头相比,SLAM摄像头在手势识别精度上表现更高,且具有良好的兼容性性。

因而,增加SLAM功能的VR、AR设备在采用手势识别时,可以直接采用SLAM灰度摄像头进行手势识别,不再需要增加额外硬件配件,不但其识别精度可以保证,兼容效果良好,也不会增加摄像头的硬件成本,同时也无需考虑设备功耗负担。以MakeSens的产品为例,在同时运行SLAM定位追踪和手势识别的情况下,即使完全使用CPU的模式下,所占用的CPU资源也能够控制在30%以内,大部分的CPU运算都能够留给软件运行实现。MakeSens基于“感算共融”智能芯片架构,以模拟信息转换技术解决能量效率瓶颈,其超低功耗智能AI芯片与传统芯片相比,能耗可以降低三个数量级。

关于MakeSens

MakeSens手势识别芯片上的创新与精进

5月12日,在由中国半导体行业协会IC设计分会(ICCAD)、芯原股份、松山湖管委会主办的“AR/VR/XR×元宇宙”的“2023松山湖中国IC创新高峰论坛”上,国产智能感知芯片厂商MakeSens(MakeSens)智能科技(北京)有限公司总经理和大家交流了传数字芯片处理高功耗形成的原因并阐明了MakeSens在模拟计算架构下是如何实现芯片低能耗的;同时,也发布了公司自主研发的,集成了多核NPU低功耗感算一体的智能芯片。

邹天琦指出: 在摩尔定律运算逻辑下,传统的数字计算架构下,90%的功耗都损耗在了数据在存储和计算单元间的搬移过程中,并没有用在数据处理过程中,且因数据搬移带来了更高的延时,同时,依赖于制程提升的逻辑芯片性能也带来工艺成本和散热的问题。

而在传统的感知计算链路下,传感器采集的数据需要经过ADS模数转换器对模拟信号进行数字信号转换,再通过DSP数字信号处理器进行处理,CPU/GPU/FPGA计算芯片进行计算。计算链路较长带来计算效率低、功耗大等问题。

相比之下,模拟计算架构通过近传感计算芯片直接对传感器采集的数据进行计算,将部分DSP芯片需要承担的任务进行前置处理,精简处理器信息后,再将处理后的数据通过ADC模数转换器传递给CPU/GPU/FPGA等计算芯片。主芯片计算的是剔除不必要信息的精简数据,减少了数据迁移量和数据处理量,进而提升了计算效率,也降低了整个计算链路的功耗。同时邹天琦还代表MakeSens发布了公司首款面向面向手势交互应用的低功耗感算一体智能芯片MKS2206。

该芯片集成多核自研NPU,该芯片支持包括图像、语音等多种感知模态。在AR/VR场景应用中,该芯片功能支持双手检测、跟踪与左右手识别;支持双手21关键点和3D坐标检测;支持多种典型手势、自定义手势。可以很好的满足AR/VR场景应用需求;可以实现画面抖动、低视频分辨率、低照度及多目标类别等情况下稳定的手势检测和跟踪功能。

在运算性能上,该芯片定位误差小于10mm;实时处理帧率大于60fps;可实现小于50ms延迟的连续无卡顿交互;检出成功率大于98%。在传感器性能上,支持MIPI-CSI接口;典型配置为640x480单色,双路分辨率最高支持1280x800;典型功耗< 200mW。同时,MakeSens还提供了完整的软件栈,易于与AP集成。

据了解,该芯片基于40nm工艺,将会在今年二季度小规模量产,2023年三季度客户导入,2024年二季度规模出货。此外,MakeSens还计划在2024年推出基于22nm工艺的新一代MK3xxx系列芯片,主要面向SLAM 6DoF定位、手势交互、眼动追踪动等场景应用。

MakeSens公司背景介绍

MakeSens公司源起于清华大学电子系集成智能感知(iVip)实验室,2015首创提出“感算共融”的智能芯片架构,利用模拟计算的高能效特性优势,极大降低了持续智能视觉感知计算下的能耗问题。MakeSens拥有一支经验丰富的模拟计算研发团队,核心人员拥有平均10年以上的行业从业经验,18次流片经验,并且与数家顶尖的公司在持续研发合作。

MakeSens推出的低功耗智能视觉感知平台的核心部件,采用自主创新架构设计,该芯片能够在复杂的识别任务中以低功耗、高精度、高性能和高稳定性脱颖而出,因此有望在AR/VR/MR以及智能座舱等复杂人机感知和交互场景中广泛部署。通过集成轻量级识别交互算法,显著降低系统功耗,提升整体性能,并达到同行业领先水平。

MakeSens的目标是在2024-2025年面向大客户的完整解决方案,并实现亿元以上营收。希望在2026-2028年完成平台服务、生态搭建,建立以自研芯片为核心的全时域智能感知服务平台,并实现IPO。

延伸阅读:
《触觉技术及市场-2022版》
《增强现实/虚拟现实/混合现实技术及市场趋势-2022版》
《AR/VR/MR光学元件技术及市场-2022版》

MEMS 中国首家MEMS咨询服务平台——麦姆斯咨询(MEMS Consulting)
评论
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 98浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 124浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 116浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 61浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 108浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 141浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 93浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 158浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 92浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 70浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 164浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 223浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 58浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 122浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 202浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦