如何实现真正的沉浸式VR和AR?

感知芯视界 2023-10-09 17:51

                                              



编辑:感知芯视界 万仞

来源:电子工程专辑


几十年来,真正身临其境的虚拟现实(VR)和增强现实(AR)的前景似乎都已非常接近,然而,随着每一项新技术的引入,似乎又都变得遥不可及了。如今的好消息是,它们距离人们的确越来越近了。然而,要想让AR和VR真正身临其境,人们所有的感官都必须确信这种体验是真实的。


创造可信的VR和AR体验,取决于工程师如何准确、一致地再现所有构成人们感知现实的元素,需要从理解人类生理学和神经科学开始。对于感知现实世界中的3D结构来说,至关重要的是人们必须首先了解多感官信号,然后再是利用耳机技术来进行模拟。



实现基于技术的现实









































VR设备遮挡了用户的视觉,呈现了一个模拟环境——在该环境中,感官刺激提供了存在感和与虚拟对象的交互。AR设备将虚拟对象覆盖在物理环境上,感官提示提供了物理元素和增强元素之间的一致性。3D AR系统也被称为混合现实设备,它在虚拟环境中融合了真实世界的元素。


每种配置都有独特的要求,但推动这些系统向前进步的常见技术,包括实时3D传感和跟踪、强大算力且节能的计算处理、高保真图形渲染和显示、沉浸式音频、机器学习和人工智能算法、直观的人机界面和新颖的应用。



身临其境的视觉体验









































通过创新的图形和显示技术,人们可以渲染逼真度更高的数字对象,并在更小的区域封装更多像素,且比以往任何时候都更清晰、更明亮。然而实际上,对于上述这些,还有更多的事情要做。其中不光是渲染逼真的图像,以及利用所需视觉提示的近眼显示。


如今的高分辨率智能手机显示器,每英寸显示500多个像素(PPI)。但对于身临其境的耳机视觉效果来说,利用PPI来度量已显不足,一个相关度更好的度量是,显示器显示视场的每度的像素(PPD)。


在中心视觉点上,典型的人眼具有大约1/60度的角分辨率。每只眼睛的水平视野约为160°,垂直视野约为175°。两只眼睛协同工作,在约120°宽和约135°高的FOV范围内实现立体深度感知。所有这些都意味着人们需要为每只眼睛提供大约100兆像素(MP),为立体视觉提供大约60MP,以提供60PPD的视觉。然而,当今最先进的主流VR头戴式耳机显示器大约才达到3.5MP。


由于目前的制造技术,还不支持这种像素密度,设计师必须在理解人类视觉系统如何工作的基础上,在高分辨率渲染视觉场景的凸显部分做出权衡。



眼睛跟踪和注视点渲染









































人类高视力敏度仅限于非常小的视场,该视觉场为以中央凹为中心、围绕眼睛光轴约±1°的范围。这意味着视觉中心最清晰,边缘趋模糊。使用实时传感器来跟踪用户的注视区域,人们可以在中心注视区域渲染更多数量的多边形,将计算能力集中在那里,并在其他地方以指数级降低图形保真度(多边形密度)。这种强化中央渲染的处理方式,可以显著减少图形工作负荷和相关的功耗。


图1:人眼的中央凹上有高密度的视锥感光体,从而导致中央视觉的视力敏度高,而周边的光受体密度显著下降,导致视力下降。(资料来源:E.Bruce Goldstein《感觉与感知》)


世界各地的研究人员正在对此进行研究,设计师正在探索多显示器配置,其中高分辨率显示器覆盖中央凹视觉,像素数相对较低的显示器覆盖周边视觉。未来的显示架构,将能够在注视方向上及其周围,动态地实时投影更高分辨率的视觉内容。



调节和会聚失配









































另一个关键问题是确保动眼神经线索的一致性,以纠正眼睛调节和会聚错配。人类用两只眼睛聚焦在一个物体上,立体地看待世界。通过调节,每只眼睛的晶状体都会改变形状,以聚焦来自不同深度的光线。两只眼睛会聚的距离与每只眼睛所适应的距离相同。


如今的商用VR和AR耳机中,汇聚距离和调和距离之间存在不匹配。现实世界中的光,是通过来自各种不同距离光源的反射和折射来调适的。而在头戴式耳机中,所有的光都是通过同一距离的光源产生的。此时,当眼睛会聚以观看虚拟物体时,其透镜形状必须不断调整,以聚焦从显示器发出的固定距离光,从而导致不同程度的距离失配,这通常会导致眼睛疲劳或定向问题。


图2:3D显示器的会聚调节失配。(来源:Martin Banks)


为解决这一问题,人们正在探索各种方法,例如动态可移动光学器件和焦点可调液晶透镜,其焦距可以随着电压的调整而改变。



3D空间音频









































对于真正的沉浸感,AR/VR音频体验必须与视觉体验相对应并协调,以便所感觉的声音位置与用户所看到的目标完全一致。在现实世界中,大多数人即使闭上眼睛,都能感知到声音的大致位置。这是因为大脑能够对声音的“到达时间”和强度进行感知和分析。这在现实世界中是自动即时发生的,然而在VR耳机中,必须对3D空间音频进行编程和处理。


挑战在于,每个人对声音信号的体验是不同的,信号频谱会根据头部和耳朵的大小、形状以及受众等因素而变化。这个被称为与头部相关的传递函数,如今的许多技术,都在致力于对其实现尽可能逼近的近似。另外,正在进行的个性化功能研究,也将使耳机用户能够以正确的空间线索来感知虚拟物体发出的声音。



低延迟由内而外跟踪









































在VR/AR中,实时跟踪用户的头部运动显然是必要的。无论何时,在3D空间内,系统都必须能够确定头戴式耳机相对于其他物体的位置,并同时确保高精度和低延迟,以便根据用户的头部位置及方向来渲染和呈现相应的视觉和听觉信息,另外,在用户移动时还要快速更新。


直到不久前,VR耳机还通过“内外”跟踪方法,利用用户放置在环境周围的外部传感器来跟踪人类头部运动。而如今,基于计算机视觉和微调运动传感器的有机结合,“由内而外”的跟踪提供了模拟定位、映射技术、以及视觉惯性测距,从而实现了头戴式耳机内的运动跟踪。


图3:通过“由内而外”的跟踪,现代耳机可以利用内置传感器实现用户动作的实时精确跟踪。(来源:Meta)


然而,一个持续的挑战是,如何实现更低的动作到光子延迟,即从目标动作开始到从显示器中相应图像帧的最后一个像素发射光子之间的延迟。换句话说,它是传感器数据采集、处理、接口传输、图形计算、图像渲染和显示更新所花费的总时间。


通常在现实世界中,根据视觉确定的视野变化以及前庭感觉系统检测到的运动信息,来跟踪人们的头部运动。如果VR耳机的延迟时间过长,会导致视觉前庭不匹配,从而导致定向问题和头晕。目前系统实现的动作到光子延迟通常为20~40ms,但感知无缝体验要求该延迟小于10ms。



人类导入和交互









































身临其境的体验还要求用户能够与虚拟对象进行逼真的交互。人们必须能够伸手抓住物体,并且物体必须按照物理定律实时做出反应。


如今最先进的耳机,让用户可以用基本的手势选择物体,随着计算机视觉技术的不断进步,还有人工智能的快速进步,未来的耳机将包括更丰富的手势控制功能。


下一代设备还将提供多模式交互及眼动追踪技术,将允许用户通过将视线集中在虚拟物体上来进行选择,然后用手势进行激活或操控。很快,随着人工智能技术的不断发展,本地低延迟处理将成为现实,耳机也将具有实时语音识别功能。


图4:计算机视觉和人工智能技术的进步,使用户能够通过手势、眼神和语音命令进行自然的交互。(资料来源:David Cardinal)



展望未来









































如今,人们可以体验一些主流的VR和有前景的工业AR,但它们并非完全沉浸式的。虽然这条路并不直接,但随着数十亿美元的相关技术投资,其潜力几乎是无限的。例如,麦肯锡估计,到2030年,元宇宙可能产生4万亿至5万亿美元的收入。


通过不断突破技术障碍,人们将能够再现逼真的体验,最终能够从根本上缩小人们在真实世界和虚拟世界体验之间的差异。


  感知芯视界媒体推广/文章发布 马女士 15900834562(微信同号)

*免责声明:本文版权归原作者所有,本文所用图片、文字如涉及作品版权,请第一时间联系我们删除。本平台旨在提供行业资讯,仅代表作者观点,不代表感知芯视界立场。



免费下载

半导体设备精选报告整理全了【41份】

最全第三代半导体产业报告大合集【57份】

激光雷达最全前沿报告集【20份】

物联网最新报告大全【704页PDF】

新材料产业七大方向全面梳理【153页PDF】

150+份传感器及产业报告【限时领】

汽车传感器超130份资源报告最全整理

揭秘半导体硅片报告大合集【20份】

MEMS传感器产业发展与趋势【附报告】



评论
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 134浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 93浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 101浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 73浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 141浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 79浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 164浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 46浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 99浏览
  • 在物联网(IoT)短距无线通信生态系统中,低功耗蓝牙(BLE)数据透传是一种无需任何网络或基础设施即可完成双向通信的技术。其主要通过简单操作串口的方式进行无线数据传输,最高能满足2Mbps的数据传输速率,可轻松实现设备之间的快速数据同步和实时交互,例如传输传感器数据、低采样率音频/图像与控制指令等。低功耗蓝牙(BLE)数据透传解决方案组网图具体而言,BLE透传技术是一种采用蓝牙通信协议在设备之间实现数据透明传输的技术,设备在通信时会互相验证身份和安全密钥,具有较高的安全性。在不对MCU传输数据进
    华普微HOPERF 2025-01-21 14:20 71浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦