IT之家 5 月 22 日消息,科技媒体 AppleInsider 昨日(5 月 21 日)发布博文,报道称苹果公司最新披露 PH2D 方法,结合人类教练和机器人示范者训练人形机器人,让其获得更高效的学习效果。
苹果公司于本周三发布《Humanoid Policy ~ Human Policy》研究论文,直指传统训练方法的不足,提出了一种可扩展且成本效益高的新方案,称为“PH2D”(Physical Human-Humanoid Data)。
苹果公司在专利中指出,传统人形机器人训练依赖机器人示范者,过程被描述为“劳动密集型”,且需要昂贵的远程操作数据采集。
IT之家援引博文介绍,苹果的新方法结合人类教练和机器人示范者,利用改造后的消费级设备,制作训练素材。
例如,Apple Vision Pro 头显被调整为仅使用左下角摄像头进行视觉观察,配合 ARKit 技术获取 3D 头部和手部姿态数据;改造后的 meta Quest 头显搭载 mini ZED 立体摄像头,成为低成本训练工具。
人类教练通过这些设备记录手部操作,包括抓取、抬起物体和倒液体等动作,录制过程中还提供语音指导,视频被放慢后用于机器人训练。
苹果为此还开发了名为“Human-humanoid Action Transformer”(HAT)的模型,能够同时处理人类教练和机器人示范者生成的数据。
这一模型构建了一个通用的策略框架,相较于仅使用真实机器人数据的训练方式,表现出更好的泛化能力和稳健性。研究显示,这种结合训练策略在特定任务(如垂直抓取物体)中,效果优于单一机器人示范者训练。
苹果的研究表明,这种结合训练方式不仅成本效益高,还能显著提升机器人表现。尽管目前仅展示了机器人灯原型,但据传苹果正在研发面向终端消费者的移动机器人,可执行家务和简单任务。