灵初智能发布首个基于强化学习的端到端具身模型 Psi R0，双灵巧手协同进行复杂操作

12 月 30 日消息，灵初智能发布首个基于强化学习（RL）的端到端具身模型 Psi R0。

1AI获悉，该模型支持双灵巧手协同进行复杂操作，将多个技能串联混训，生成具有推理能力的智能体，从而完成并闭环长程灵巧操作任务。并且，Psi R0 还可以实现跨物品、跨场景级别的泛化。

以电商场景为例，商品打包是典型的长程任务作业，需对上万件商品进行抓取，扫码，放置，塑料袋打结等多个操作。Psi R0 能够使用双灵巧手流畅地完成这一系列动作（官方称此系列动作在客户现场可以取代一个完整工位），成为首个基于强化学习训练完成长程灵巧操作任务的具身机器人。

官方表示，基于 RL 的 Psi R0 模型，使用海量仿真数据训练出双手操作的智能体，并通过双向训练框架串联多技能，在业界率先完成开放环境中的长程任务，具备较强的泛化能力与较高的鲁棒性（robustness）。

这一技能训练框架从物体时空轨迹抽象出关键信息以构建通用目标函数，从而解决奖励函数难设计的问题。在后训练阶段，通过少量高质量真机数据对齐，进一步提升长程任务的成功率。

除此之外，双向训练框架中的转移可行性函数发挥着重要作用，它能够微调技能以提高串联的成功率与泛化性，同时赋予模型自主切换技能的能力，使其在遭遇操作失败时能够迅速调整策略，确保高成功率。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

灵初智能发布首个基于强化学习的端到端具身模型 Psi R0，双灵巧手协同进行复杂操作

迅雷将在杭州成立 AI 全球总部

大模型 DeepSeek：未授权任何人员参与机构投资者交流会，网传交流信息不实

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

相关内容：

迅雷将在杭州成立 AI 全球总部

大模型 DeepSeek：未授权任何人员参与机构投资者交流会，网传交流信息不实

Krea AI将推视频生成功能 界面更加简洁美观了

马斯克：可能在明年年底前出售特斯拉人形机器人 Optimus

「Her」主创 Alexis Conneau 宣布从 OpenAI 离职，OpenAI GPT-4o 背后灵魂人物辞职创业

OpenAI发布具推理能力的人工智能模型，OpenAI o1模型登场

请输入验证码

....支付确认中....

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注

Krea AI将推视频生成功能界面更加简洁美观了