高马尔
一个信息发布的网站

人形机器人优雅漫步,强化学习新成果!独角兽Figure创始人:之前大家吐槽太猛

今天小编(幸聽楓)要和大家分享的是人形机器人优雅漫步,强化学习新成果!独角兽Figure创始人:之前大家吐槽太猛,欢迎阅读~

注意看,机器人像人一样从容地走出大门了!

甚至,还有一整支机器人队伍迎面走来。

人形机器人独角兽 Figure,再次带来他们的新成果——利用强化学习实现自然人形行走

跟之前版本的机器人相比,确实更像人了许多,而且步态更加轻盈,速度也更快。

网友们纷纷表示被惊艳到,甚至觉得像是太空行走

有一说一,自从与 OpenAI 取消合作后,这成果输出确实又快又多。

机器人像人一样自然行走

此次推出的,是经过强化学习训练的端到端神经网络。

根据官方介绍,主要抽成三个部分:

强化学习:强化学习利用模拟试验和错误,教 Figure 02 人形机器人如何像人一样行走。

模拟训练:通过高保真物理模拟器学习如何像人类一样行走,结果只需几个小时就能模拟出多年的数据。

Sim-to-Real:通过将仿真中的網域随机化与机器人上的高频扭矩反馈相结合,模拟训练无需额外调整即可直接转换为真实硬體。

具体来看。

首先,利用强化学习技术,在 GPU 加速物理仿真中对新的行走控制器进行了全面训练,并在几个小时内收集了数年的仿真演示数据。

在模拟器中,数以千计的 Figure 02 机器人被并行模拟,每个机器人都有独特的物理参数。

然后,这些机器人将暴露在它们可能遇到的各种场景中,并通过单一神经网络策略学习如何操作它们。这包括遇到各种地形、致动器动态变化以及对绊倒、滑倒和推搡的反应。

使用强化学习学习到的策略可能会趋近于次优控制策略,无法捕捉到人类行走的风格属性。这包括以类似人类的步态行走,脚跟着地、脚尖离开、手臂摆动与腿部运动同步。

于是他们通过奖励机器人模仿人类的行走参考轨迹,将这种偏好注入到学习框架。这些轨迹为策略允许产生的行走方式建立了先验,而额外的奖励条款则优化了速度跟踪、功耗以及对外部扰动和地形变化的鲁棒性。

最后一步是将策略从模拟中提取出来,应用到真正的仿人机器人中。仿真机器人充其量只是高维机电系统的近似值,在仿真中训练的策略只能保证在这些仿真机器人上有效。

为了弥补这一 " 模拟到现实的差距 ",他们在模拟中结合使用了網域随机化和机器人上的kHz- 速率扭矩反馈控制

網域随机化通过随机化每个机器人的物理属性,模拟策略可能需要运行的各种系统,从而弥合模拟与现实之间的差距。这有助于该策略在不进行任何额外微调的情况下,实现与物理机器人的 " 零接触 "。

用 kHz 速率闭环扭矩控制来运行策略输出,以补偿执行器建模中的误差。该策略对机器人与机器人之间的变化、表面摩擦力和外部推动力的变化都很稳健,在整个 Figure 02 机器人群中实现了可重复的仿人行走。

于是乎,就看到了 10 个机器人同一步态行走,没有任何调整或变化。

接下来,他们计划将这一技术扩展到数千个 Figure 机器人。

人形机器人越来越像人了

之所以这次选择对机器人步态的改善,Figure 创始人也说了,这并非是他们的首要任务,只是之前网友吐槽得多了,他们最终目标是商业运送机器人。

By the way,今年伊始海内外的人形机器人都密集亮相,诸多大厂企业开始投身机器人的布局当中,这不今天同一天,vivo 宣布成立机器人 Lab。

在这些机器人持续整活之中,能够看到他们举手投足之间着实越来越像人了

且不说跟大爷一样在公园遛弯、跑步、二人转之类。

还学会了人类的一些空翻、托马斯全旋等等杂技。

你还期待人形机器人哪些地方可以像人的?

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

最后一周!2025 年值得关注的 AIGC 企业产品 报名即将截止

下一个 AI" 国产之光 " 将会是谁?欢迎申报奖项!

本次评选结果将于 4 月 16 日中国 AIGC 产业峰会上公布。

一键星标

科技前沿进展每日见

关于人形机器人优雅漫步,强化学习新成果!独角兽Figure创始人:之前大家吐槽太猛就分享完了,您有什么想法可以联系小编(幸聽楓)。