苹果Vision Pro对智能汽车的启示未来人机交互应该是什么样？

来源：看点时报 2023-06-16 15:15:19

事实上，可穿戴的头显并不是一个稀奇的品类。从上世纪起，就不断有VR眼镜出现。2016 年被称为消费级VR眼镜的元年，HTC、Oculus 等公司都有相应的明星产品发布，一时间在 VR市场掀起了不小的波澜，但是它们在功能开发上长期以游戏需求为主导，有明显的产品圈层限制。

时至今日，头显产品的热度已远不及当年，究其原因这里头的因素有很多，其中的圈层限制只是一方面，我认为更多的还是产品痛点本身。

Apple Vision Pro 之所以能够重启头显市场的热度，这不单单是「苹果光环」那么简单，关键还得归功于苹果在产品上带来的革新，这也是苹果一直以来的核心竞争力，而这种能力值得所有做硬件的公司去学习。

今天我们就以 Vision Pro 为线索，从产品开发层面聊一聊它对智能汽车又会带来哪些启示？大家又能否从ROBO-01找到一些共鸣？

软硬件+生态，Vision Pro解决三大痛点

在硬件上，Vision Pro把「堆料」做到了极致。

几个比较关键的硬件，首先是M2+R1的双芯片组合，其中为人熟知的M2是苹果原本应用在Mac上的旗舰芯片，如今被搬到头显上，可见小小的Vision Pro却具备PC级的处理性能；

Micro OLED 显示屏：可实现单眼分辨率 4K、双目 8K，超高分辨率能够让用户得到更细腻的视觉体验；

12 个摄像头和 5 个传感器：可精准追踪手部/头部动作以及眼球的动态，无需额外遥控硬件即可完成交互。

......

光有前瞻硬件肯定是不够的。

软件层面，比如手/头/眼追踪的算法，对手势和眼部的感知精准度决定了 Vision Pro 是否能够准确识别使用者的意图，从而营造丝滑的交互体验。这一点从现场媒体的实际体验上来看，Vision Pro 的体验是一骑绝尘的。

还有 Cinema Environment、空间音讯与自动适配空间系统、EyeSight 视觉线索等等功能，它们所基于的全新 visionOS 操作系统借助了 Unity 引擎的能力，让苹果的头显设备展现出了远胜于竞品的沉浸式交互体验和真实感。

当然，还有苹果一直引以为傲的自有生态、庞大的开发者群体以及强大品牌号召力。只是在发布会上苹果展现得比较有限，比较重磅的就是官宣了即将接入迪士尼的内容。

借用知乎博主 @王禹效Legolas所总结的，Vision Pro 解决了同类产品的三大痛点：

1、虚拟和现实的界限不清晰

2、操纵体验繁琐，且精准度始终差了一些

3、生态中没有内容支撑

对智能汽车的启示 机器人化交互应该是什么样？

对于Vision Pro和智能汽车联系，大家第一时间联想到的是 VR/AR 上车后的应用，而笔者更认为，它的启示更在于产品开发上的「从哪来，到哪儿去」。

Vision Pro 解决的前两大痛点所指向的产品特征可以用两个行业「黑话」一言蔽之：更沉浸、多模态交互。

类似的痛点不仅存在于可穿戴的数码产品，在汽车的智能座舱的研发上同样有着很强的借鉴性，而座舱之外的智驾系统某种意义上也贯彻类似的思路：高硬件+强软件，最后的落脚于场景，将强大的软硬件能力转化为优质的体验。

因为从本质上来说，智舱和智驾也是Vison Pro「空间计算」的两大典型应用。

「空间计算」一词由 Simon Greenwold 于 2003 年在麻省理工学院的硕士论文中提出：「空间计算是人类与机器的交互，其中机器保留和操纵真实对象和空间的参照物。它是一种使我们的机器在我们的工作和娱乐中成为更充分的合作伙伴的重要组成部分。」

所以笔者认为，Vision 对智能汽车的启示可以分为表层和深层两个维度：

表层：软硬件+生态的全布局，一台优秀的智能产品需要兼顾这些特质。

深层：用场景说话，产品的魅力不止于「堆料」，更重要解决了哪些体验痛点。

相对于硬件，场景体验的概念是抽象的。在智能汽车愈加硬件同质化的当下，体验上的打磨开始成为各车企角逐的焦点，这一指标也更多考验的是企业对用户的理解程度。

有了Vison Pro的先例打样，我想未来的Apple Car苹果汽车上同样会有类似的开发理念进行呈现，比如将车规版的「M」系列芯片引进上车、比如将显示细腻的OLED屏幕大量应用到汽车上、又或者把空间音频和这次头显上首次应用的虹膜识别技术放进座舱......

在软硬件的整合能力上，苹果一直都是老道的，只是苹果汽车项目目前仍然前途未卜，这一切或许还只能说是「空中楼阁」。那么在苹果汽车遥遥无期之时，有没有一家公司能够把上述理念深刻贯彻到可落地的智能电动车上呢？答案是肯定的。

基于百度和吉利的双重背景，集度是一家充分拥有硬件积淀和软件底蕴的ROBOCAR汽车机器人公司，最重要的是，集度汽车机器人产品理念和我们今天聊到的「启示」是高度契合的。

2022年，集度率先在汽车领域开了一场「元宇宙」发布会也将智能汽车的形象提到了一个全新的维度——汽车机器人。

ROBO-01初亮相时，集度一口气亮出了汽车机器人养成模式和汽车机器人神经网络JET（JIDU Evolving Technology）、真冗余高阶智能驾驶方案、基于SOA的舱驾融合、毫秒级离线智能语音等核心技术能力。而这些能力，很快就会随着ROBO-01交付而落地实现。

由于亮点太多，一文不能尽述，所以我们不妨就以核心的智驾和智舱为例展开简要的讨论。

首先，作为智能化的基建，ROBO-1 在硬件埋设上是极为前瞻的。智驾方面，车外遍布 31 个智能传感器，其中有 2 个 128 线高分辨率激光雷达、5 个毫米波雷达、12 个超声波雷达、12 个高清摄像头，做到了感知无死角。同时，两颗 Orin-X 高算力芯片坐镇中央，可以轻松处理丰富传感器所带来的庞大数据，进而为车辆的科学决策形成「智力」保障和安全冗余。

软件上，依托强大的感知和计算硬件，集度有Apollo多年积累的L4级算法的底层赋能，拥有超过5000万公里的运营测试数据支撑。该算法使用BEV模型，通过轻量化的高精地图用于补强了感知算法。数据上采用图文弱监督预训练的文心大模型，而且在底层数据闭环。

智舱方面，刚进入车内映入眼帘的就是一块 35.6 英寸的 3D 无界大屏，它拥有 6K 的分辨率。支撑其丝滑运行的是集度在国内首发的 8295 芯片，这是高通目前最先进的车载芯片，它采用 5nm 制程，拥有 30TOPS 的 AI 算力，相当于时下主流 8155 的 8 倍。

在 8295 的算力支持下，集度率先做到了语音AI算法全量本地化，语音识别和响应速度都在毫秒级，此外还打破了「没网」就无法语音交互的行业痛点。总的来说，这套全离线语音具备响应速度快、识别能力强、识别稳定、隐私保护好等各种领先于行业的产品特征。

不止于此，和智驾系统一样，ROBO-1 的座舱同样集成了丰富的传感器，可以通过语音、手势等等方式方便用户与车机进行交互，做到「一个眼神，秒懂」在这一点上，多模态交互的理念和 Vision Pro 更是不谋而合。

而所谓「沉浸」，ROBO-01 在软硬件层面下足了功夫，依托 6K 大屏极高的显示素质，智舱团队为舱内准备了游戏厅、KTV、观影厅、小憩等多种沉浸式功能，在 Unity 的引擎驱动下，系统能够充分发挥 8295 的算力，让车机游戏等应用发挥出极为震撼的 3D 视觉效果。

由于 ROBO-01 还未正式交付，更多关于座舱的细节暂且按下不表。可以预见的是，在强大软硬件加持下的 ROBO-01 将为用户提供更沉浸、交互更自然的智舱体验。

集度深知，好的产品需要有前瞻且丰富的硬件打底、高智慧的软件算法完成上层建筑，以用户体验为核心指标，从场景出发不断拓展智能汽车的应用边界。这一点，是 Vision Pro 唤醒头显市场「一潭死水」的关键，也是集度要在新势力中一鸣惊人的底气所在。

责任编辑：kj005

文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com