10月25日至27日,2024中国智能机器人大会(CCIR 2024)在武汉召开。作为国内机器人领域最具影响力的学术会议之一,本届大会汇集了徐宗本、王耀南、乔红、于海斌等多位国内外院士以及一批人工智能和机器人领域知名专家,共同研讨与促进智能机器人与智能制造相关理论、技术及应用的发展。国地共建具身智能机器人创新中心(以下称为“创新中心”)CTO唐剑博士受邀出席大会,并作专题报告。
唐剑博士进行了题为《AI大模型与具身智能:打通人形机器人的任督二脉》的专题报告,分享AI大模型与具身智能在人形机器人领域的重要应用。
唐剑博士指出,AI大模型与具身智能是人形机器人领域的关键技术,为人形机器人的发展带来了革命性的突破。第四次科技革命浪潮发展到今天,从海量互联网大数据驱动的数据智能,到基于物理身体进行感知和行动的具身智能,飞速发展的人工智能正在积极影响人类生存的物理世界。
早在1950年,具身智能就是图灵提出的人工智能的两条发展道路之一,但直到今天,具身智能的应用仍然面临着莫拉维克悖论:对人类来说困难的任务对机器人相对简单,而对人类来说很简单的任务对机器人反而很难,如何应对现实中不确定的场景、不固定的流程、多种多样的物品及众多可能出现的操作失误,是具身智能应用必须面对的挑战。
唐剑博士介绍,创新中心作为引领具身智能技术突破与产业协同发展的关键平台,在“具身”(人形机器人的本体以及运动控制)与“智能”(智能体及其关键技术)两大领域深度探索,尝试解决行业发展的关键难题。
在“具身”方面,创新中心在今年4月27日发布了“天工1.0 LITE”,实现了全球首个纯电驱全尺寸人形机器人的拟人奔跑,并在118天内完成两次迭代,“天工1.1PRO”具备了上下肢协同作业及智能交互能力,“天工1.2 MAX”具备更大负载、更快速度、更长续航,拥有强大的动作控制、导航定位和自主决策能力,实现全链路具身智能能力闭环。此外,创新中心还发布了具身智能服务机器人“天轶”,拥有轮式全向移动能力,并搭载具身智能情感大模型,可进行智能情感交互。
强大的运动控制能力是具身智能机器人在多场景落地应用的基础,在运动控制方面,基于创新中心独创“基于状态记忆的预测型强化模仿学习”方法,“天工”拥有全球最强的具身智能机器人运动控制能力,率先实现了基于网络的全身协同控制和感知行走,且具有物理和空间感知能力的多模态操作能力,不仅实现了在平地和跑步机上的稳定奔跑,在斜坡、楼梯、草地、碎石、沙地多种复杂泛化地形中实现平稳移动,还能高拟真度还原人类动作,模仿人类复杂技能,执行语音交互、无序抓取等多种复杂任务。
在“智能”方面,AI大模型+机器人为智能化的机器人带来了可能。AI大模型驱动的任务规划(具身大脑)负责逻辑推理、场景理解、任务拆解和人机交互等高层次的决策,数据驱动的端到端技能执行(具身小脑)负责技能库执行、错误处理、全身运动、实时反馈等底层任务,两者相互协作,组成了具身智能的新范式。
唐剑博士表示,具身大脑与小脑的结合构建高性能具身智能体的核心所在,当前创新中心正在加速开发高性能具身智能体“开物”,并致力于实现“一脑多机”和“一脑多能”的通用具身智能,适配不同构型的具身智能机器人,满足多场景下的海量任务需求。
创新中心为“开物”构建了分布式的具身智能体架构,云端的超脑交互问答大模型具有强大的算力和完备的知识库与互联网API,用于处理需要复杂逻辑和海量知识信息的语音理解和问答交互;端侧则通过具身任务执行小模型和智能运动小脑微模型,快速处理效率要求高、频次高的操作和控制指令,合理分布不同尺寸和运行速度的模型,显著提高智能体的整体性能。
如同AI大模型为人机交互带来革命性的变革一样,具身智能体正在让AI能够精准地与物理世界交互,从而真正提升社会生产力与生活体验。
为了加速具身智能落地,在数据集方面,创新中心正在建设具身智能数据生产、采集、标注和存储一体化的国家级数据采集训练场,旨在打造全球范围内规模最大、信息最稠密、最通用的具身智能数据集,持续开展数据集和数据应用建设,结合数据母机和数据平台建设,打造具身数据生态,联合全行业推动具身智能数据采、标、存、管、用实践与规范,实现具身数据零门槛应用和赋能。
随着AI大模型与具身智能技术的快速更新迭代,具身智能机器人产业迅猛发展,并逐步从技术研究向实际应用转化。创新中心作为国家级具身智能机器人创新平台,将充分发挥关键技术攻关、产业生态培育等方面优势作用,持续聚焦具身智能机器人关键共性技术研发和生态建设,成为创新策源地和示范应用高地推动技术成果应用落地及产业化,为具身智能机器人技术和产业发展贡献力量。