8月28日,2024深圳(国际)通用人工智能大会暨深圳(国际)通用人工智能产业博览会在深圳国际会展中心盛大开幕。大会集结了来自全球顶尖科研院所、龙头企业的500+知名学术专家、产业专家,共同探讨包括人形机器人、具身智能、大模型、多模态、AIGC等AI领域的前沿话题。天娱数科首席数据官吴邦毅博士受邀出席“2024全球人工智能大模型及应用高峰论坛”,并以《3D大模型与空间智能 让AI从桌面迈入工业应用》为题,进行了精彩分享。
3D空间智能,是我们对真实世界全面感知、理解、交互与决策能力的一次质的飞跃。吴邦毅表示,“聚焦 AI+3D,天娱数科融合智者千问大模型、3D 数据集与可视算法,打造了面向3D空间智能领域的元享空间智能MaaS平台,提供基础大模型服务,加速向全场景渗透、智能体演进,以实现‘让虚拟世界更真实,让真实世界更智能’的目标。”
一、实现通用智能(AGI)的三个关键
吴邦毅指出,实现通用人工智能(AGI)有三个关键:
第一,空间智能是让AGI从桌面迈入工业应用的关键。吴邦毅说:“3D空间智能带来的生产力跃升,在工业领域将尤为显著。”目前,大多数大型AI模型主要集中在2D领域,如语言处理、图像和视频分析,但在工业应用中凤毛麟角,“本质原因在于工业场景是3D空间,而目前绝大部分大模型为语言、图形、视频等2D模型,在工业场景应用时存在空间计算鸿沟。”与2D智能相比,3D空间智能能够更全面地感知、理解、交互和做出决策,它重新塑造了人、机器与现实世界及虚拟世界之间的联系,具有更强的泛化能力和创新特性。
3D空间智能通过捕捉深度信息,使AI能够更精确地识别物理世界中人和物体的形状、结构和位置,创造出更加逼真的场景,并提供更直观的可视化效果,让虚拟世界更真实。同时,3D空间智能还能在三维环境中像人类一样对视觉信息进行高级视觉推理,突破了二维视觉的限制,让真实世界更智能。吴邦毅认为,空间智能技术进步将为多个产业特别是具身智能、智能制造、低空经济等产业带来颠覆式的变革。
第二,3D大模型是发展空间智能的关键。提到如何发展空间智能时,吴邦毅表示:“3D大模型是推动空间智能技术发展的关键。为空间智能提供了多模态数据融合、空间计算、复杂场景处理、交互性增强、3D生成式AI等多方面的支持。”
在具身智能和人形机器人领域,3D多模态大模型与机器人技术的结合, 使机器人不但具备理解、记忆、推理等认知水平,还能认识和理解真实的3D物理世界,在作业场景中具备自主决策、行动与操作能力。
在智能制造领域,3D大模型通过整合人、机、物和环境的3D数据,实现了生产流程的3D重构。这不仅能提高生产和物流的效率、降低成本,还促进了产业的升级和创新。
在低空经济领域,3D大模型能够提升飞行器在飞行中的智能感知、识别、导航和避障能力。通过对低空空域的环境、飞行活动和基础设施进行3D重构,可以有效解决感知能力不足、智能化水平低、应用成本高等问题。
第三,3D数据集是发展3D空间智能大模型的关键。3D空间智能大模型的发展离不开大规模、高质量的3D数据训练。高质量3D数据集的稀缺已成为行业发展的一个主要障碍。目前,最大的3D数据集Objaverse的规模仅达到百万级别,与2D数据相比差距显著。3D数据的采集和处理不仅成本高昂、流程复杂,而且标准化程度低,导致数据共享和复用难度加大,这些都限制了空间智能技术的发展。
吴邦毅表示:“为解决这一问题,天娱数科通过多种毫米级 3D 扫描设备,采集 3D 模型、动作、表情等多类数据源,构建高质量多模态数据集,目前拥有超 80 万条 3D 数据、 35 万条多模态数据,服务 3D 多模态大模型训练。”
二、聚焦AI+3D,空间智能MaaS平台实现算法、模型双备案
作为企业级AI应用开拓者,天娱数科专注于空间智能领域的多模态大模型服务(MaaS),在AI与3D技术的结合上进行了深入的研究和布局。吴邦毅介绍,天娱数科的空间智能MaaS平台通过集成先进的算法和模型,不仅优化了3D数据的处理和分析,还增强了虚拟与现实世界的交互体验。
吴邦毅表示:“过去三年,依托空间智能MaaS平台,我们在文旅、教育、营销、金融领域服务了近百家客户,包括中国日报、内蒙古阿拉善电视台、云南农职院、五芳斋、天河城、杨国福、华润雪花等,进一步证明了公司在企业级AI应用领域的领先地位和影响力。”
吴邦毅还重点介绍了空间智能MaaS平台的两大核心功能:“空间智能MaaS平台有两大功能,一是AI+3D可视化功能,为多个行业如消费、文旅、展会、金融、教育和影视提供虚拟3D场景和AI数字人交互的大模型服务,加快3D内容的创新和更新,增强虚拟世界的逼真度;二是AI+3D数据集功能,利用高精度3D扫描技术收集模型、动作和表情等数据,构建高质量数据集,支持3D多模态大模型的训练,并适用于空间计算、具身智能和机器人等场景,提升现实世界的智能化水平。”
此外,在技术实力方面,空间智能MaaS平台已实现算法、模型双备案。天娱数智者千问大模型以及“智境云创人脸融合算法”“智境云创文本生成视频算法”“智者千问大语言模型算法”均获得了中央网信办备案。
结语:把握空间智能时代发展机遇,天娱数科积极推进"1+1+N"模式,建设1个全国最大规模的高质量3D数据集,开发1个国产高性能3D空间智能大模型,通过DaaS(数据即服务)和MaaS(模型即服务)实现在具身智能、人形机器人、智能制造、低空经济等N个场景的创新应用,加速形成"技术-产品-平台-服务"的产业生态,为相关产业转型升级注入丰富动能。