灵初智能发布10万小时人类数据计划,Psi-R2系统协同登顶全球基准评测
2026-04-13 10:04:36
具身智能领域正迎来一场关键变革,行业焦点逐渐从依赖真机遥操作数据转向挖掘人类操作数据的深层价值。传统模式下,真机数据采集成本高昂、效率低下,且难以真实反映复杂场景中的操作节拍与稳定性要求。当实验室演示与工业现场实际需求产生鸿沟时,如何将人类积累的操作经验转化为机器人可规模化学习的能力,成为决定下一阶段竞争格局的核心命题。
某智能科技公司近期发布的创新成果,为这一难题提供了系统性解决方案。其推出的策略模型Psi-R2与世界模型Psi-W0,配合近10万小时的人类操作数据集,构建起"数据-模型-强化学习"三位一体的技术框架。其中首批开源的1000小时人类手部操作数据,凭借多场景、多任务、多物体的覆盖特性,成为当前全球规模最大的同类数据集之一。这套体系包含5417小时真机数据与95472小时人类数据,通过分层数据结构实现精度与泛化能力的平衡——高精度数据确保操作上限,大规模数据提供场景适应性。
技术实现层面,研发团队突破传统数据对齐的思维定式。面对人手与机械手在运动学、动力学上的本质差异,团队放弃复杂的数据修饰方法,转而采用"原始数据输入输出"的简洁策略。通过运动学映射实现关节维度对齐,保留图像原始信息直接输入模型,这种设计使Psi-R2具备同时预测未来视频帧与机器人动作序列的能力。基于预训练视频生成模型架构,该策略模型仅需不足百条真机轨迹微调,即可完成手机装配、工业包装等复杂任务。
世界模型Psi-W0的引入,则构建起虚拟试错空间。该模型在预测未来视频的基础上,特别强化对失败场景的建模能力,其训练数据中包含约30%的失败案例。通过接收图像、语言及动作轨迹信息,Psi-W0能够评估策略模型的输出轨迹,在机器人动力学约束下进行精细化修正。这种"人类策略输入-世界模型评估-强化学习优化"的闭环机制,形成持续进化的数据飞轮:优质轨迹回流训练集,失败案例提升模型鲁棒性。
工程优化为技术落地扫清障碍。通过模型压缩、编译优化与量化技术,系统推理时延从2.2秒压缩至100毫秒以内,满足连续精细操作的实时性要求。成本维度上,人类数据采集成本较传统真机方案降低超90%,且采集节拍更贴近真实作业场景。在艾伦人工智能研究所发起的MolmoSpaces权威评测中,Psi-R2在不使用特定机器人数据的情况下,以46.4%的成功率登顶Combined榜单,在任务覆盖率与综合性能上超越NVIDIA、PI等国际顶尖团队。
行业观察指出,这套解决方案的价值不仅在于技术突破,更在于重新定义了具身智能的发展路径。当数据分布的重要性排序被确立为"任务多样性>物体多样性>>场景多样性",当触觉信号被视为跨具身交互的通用语言,整个领域的研究范式正在发生根本性转变。随着首批开源数据的释放,全球研究者将获得验证新范式的公共基准,这或许标志着具身智能从实验室演示向工业级部署的关键转折。
相关阅读
-
那些每天黑小米、抱负、华为的人图什么:新华社发文揭秘科技前沿 2026-04-13 10:02:04
-
低调、精准、有温度——高净值人群为何将瑞族V-ZUG视为生涯方法的底色?深度解读 2026-04-13 10:00:06
-
卓驭科技沈劭劼:智能驾驶向挪动物理AI演进,原生多模态模子引领新方向深度解读 2026-04-13 09:59:25
-
4月20日发布,华为Pura X Max全方位外观发布:共三款配色科技前沿 2026-04-13 09:55:58
-
启明星斗深化中挪动协同结构AI保险,手艺晋级与股东报答双轨并进深度解读 2026-04-13 09:54:05
-
2026年科大讯飞进修机怎样选?六款口碑佳作知足孩子多元进修需要资讯百科 2026-04-13 09:50:51
-
央视暴光测醛仪乱象:抽检50件全军覆没 3400元产物也测禁绝科技前沿 2026-04-13 09:50:19
-
《举动设计》发布:AI教育加快普及,教员素养提拔与科研创新齐推动深度解读 2026-04-13 09:48:29
-
郑丽文观赏小米汽车工场赞不绝口,雷军接见赠手机,婉言想带车回家资讯百科 2026-04-13 09:44:28
-
宇树机械人应战博尔特速度背地:手艺验证、市场结构与工业新走向深度解读 2026-04-13 09:41:47