久久精品欧美日韩精品/狠狠色婷婷久久一区二区三区/国产精品午夜无码av体验区/丰满人妻av无码一区二区三区/成人做爰A片免费看网站爱酱

靈初智能發布首個基于強化學習的端到端具身模型 Psi R0

靈初智能近日發布了其首個基于強化學習(RL)的端到端具身模型 Psi R0。該模型通過雙靈巧手協同操作,能夠完成復雜的長程任務,并具備跨物品、跨場景的泛化能力。

Psi R0 在電商場景中表現尤為突出。以商品打包為例,這一任務涉及抓取、掃碼、放置、塑料袋打結等多個操作步驟。Psi R0 能夠流暢地完成這一系列動作,官方表示,該模型在客戶現場可以取代一個完整工位。

該模型通過海量仿真數據訓練出雙手操作的智能體,并采用雙向訓練框架串聯多技能,率先在開放環境中完成長程任務。其技能訓練框架從物體時空軌跡中抽象出關鍵信息,構建通用目標函數,解決了獎勵函數難設計的問題。

在后訓練階段,Psi R0 通過少量高質量真機數據對齊,進一步提升長程任務的成功率。雙向訓練框架中的轉移可行性函數則微調技能,提高串聯的成功率與泛化性,使模型在遭遇操作失敗時能夠迅速調整策略,確保高成功率。

最新文章
Copyright ? DoNews 2000-2025 All Rights Reserved