首页 / 新闻中心 / 正文
以高质量数据推动行业加速,北京人形加入数据标注产业伙伴计划
北京人形创新中心
2025-07-11


近日,北京人形机器人创新中心(下称北京人形)参与2025全球数字经济大会数据要素发展论坛。北京人形具身数据负责人李广宇受邀出席,并代表北京人形正式加入数据标注产业伙伴计划,北京人形与北京大学联合推出的大规模多构型智能机器人数据集和Benchmark“RoboMIND” 同期入选北京市高质量数据集资源建设成果。

国家数据局、北京市人民政府相关负责人,各地政府领导,中国科学院院士鄂维南、中国工程院院士邬贺铨、世界知识产权组织前总干事、联合国可持续发展目标与领导力发展中心咨询委员会联席主席Francis Gurry等行业专家及中外机构代表等600余人参加会议。通过创新成果展示、中外嘉宾思想碰撞、圆桌对话交流、区域合作共建发布等形式,共同探索数据“供、流、用、安”等发展趋势,促进数据要素市场高质量发展。

随着人工智能产业对数据标注需求的持续增长,为应对数据标注产业提质增效的关键挑战,构建开放协作新范式,“数据标注产业伙伴计划” 在论坛上正式启动。北京人形、北京国际大数据交易所,中国移动北京分公司,成都、沈阳、合肥、长沙、海口、保定、大同、天津、呼和浩特等9家数据标注基地运营方,智能标注企业及数据应用需求机构等共同加入,以生态合力推动数据产业向规范化、高质量发展迈进。

作为具身智能产业创新的国家级平台,北京人形始终高度重视具身数据建设,已建成国内领先的大规模异构具身智能数据采集训练场,已采集超过百万条高质量具身智能数据,覆盖工业、商业、家庭等多样化真实应用场景,高标准、高效率、高质量的数据采集与训练平台,为具身智能产业提供强有力的数据支撑。

北京人形与北京大学联合推出的大规模多构型智能机器人数据集和Benchmark“RoboMIND”,也于同期在论坛上宣布入选北京市高质量数据集资源建设成果。截至目前,RoboMIND已在北京人形机器人创新中心官网、HuggingFace平台、北京人工智能公共算力平台累计下载三万余次,已成为具身智能领域应用最广泛的开源具身数据集之一。

在具身数据的标准体系建设上,北京人形正牵头推进多个国家、行业级标准制定。数据场建设规范方面,在研标准具身智能数据场建设规范的GBZ标准及地标明确了物理空间构建、设备部署、数据采集等全链路标准。在数据采集规范方面,北京人形制定了具身智能数据采集规范行标,规定了基于具身智能本体采集数据的格式和过程要求。此外,具身智能数据质量评估国标与行标也正在同步推进,涵盖数据采集规范、预处理及质量评估等关键环节,将为数据的质量把控和有效利用提供明确的指导和依据。

近日,北京人形还正式发布了与北京市建筑设计研究院联合打造的高保真铰接物体数字资产数据集ArtVIP,实现了对高复杂度铰接物品的高精度仿真,在还原物品视觉外观的同时,以高保真度复现了物品物理特性,并且开源了6个支持全场景交互的虚拟机器人训练场,同时提供针对不同场景不同物品的定制化建模服务,改善困扰具身智能训练的 Sim2Real 问题。

依托自研平台与完善的工具链,北京人形已形成一整套标准、高效、可复制的数据采集与训练场建设解决方案,具备支持多种具身智能体、多模态数据、多场景定制采集任务的能力。

目前,数据采集与训练场建设解决方案已面向具身智能行业开放合作,可提供从数据采集、平台工具链搭建到训练场建设的全流程服务,赋能具身模型训练,加速具身智能应用落地。

依托行业领先的具身数据采集能力、高质量数据集成果和标准化体系,北京人形正持续构建开放共享的具身数据服务生态。未来,北京人形将持续夯实数据基石,为中国乃至全球具身智能机器人产业的创新发展提供坚实的数据支撑。




Top