高馬爾
一個信息發佈的網站

人形機器人優雅漫步,強化學習新成果!獨角獸Figure創始人:之前大家吐槽太猛

今天小編(幸聽楓)要和大家分享的是人形機器人優雅漫步,強化學習新成果!獨角獸Figure創始人:之前大家吐槽太猛,歡迎閱讀~

注意看,機器人像人一樣從容地走出大門了!

甚至,還有一整支機器人隊伍迎面走來。

人形機器人獨角獸 Figure,再次帶來他們的新成果——利用強化學習實現自然人形行走

跟之前版本的機器人相比,确實更像人了許多,而且步态更加輕盈,速度也更快。

網友們紛紛表示被驚豔到,甚至覺得像是太空行走

有一說一,自從與 OpenAI 取消合作後,這成果輸出确實又快又多。

機器人像人一樣自然行走

此次推出的,是經過強化學習訓練的端到端神經網絡。

根據官方介紹,主要抽成三個部分:

強化學習:強化學習利用模拟試驗和錯誤,教 Figure 02 人形機器人如何像人一樣行走。

模拟訓練:通過高保真物理模拟器學習如何像人類一樣行走,結果只需幾個小時就能模拟出多年的數據。

Sim-to-Real:通過将仿真中的網域随機化與機器人上的高頻扭矩反饋相結合,模拟訓練無需額外調整即可直接轉換為真實硬體。

具體來看。

首先,利用強化學習技術,在 GPU 加速物理仿真中對新的行走控制器進行了全面訓練,并在幾個小時内收集了數年的仿真演示數據。

在模拟器中,數以千計的 Figure 02 機器人被并行模拟,每個機器人都有獨特的物理參數。

然後,這些機器人将暴露在它們可能遇到的各種場景中,并通過單一神經網絡策略學習如何操作它們。這包括遇到各種地形、致動器動态變化以及對絆倒、滑倒和推搡的反應。

使用強化學習學習到的策略可能會趨近于次優控制策略,無法捕捉到人類行走的風格屬性。這包括以類似人類的步态行走,腳跟着地、腳尖離開、手臂擺動與腿部運動同步。

于是他們通過獎勵機器人模仿人類的行走參考軌迹,将這種偏好注入到學習框架。這些軌迹為策略允許產生的行走方式建立了先驗,而額外的獎勵條款則優化了速度跟蹤、功耗以及對外部擾動和地形變化的魯棒性。

最後一步是将策略從模拟中提取出來,應用到真正的仿人機器人中。仿真機器人充其量只是高維機電系統的近似值,在仿真中訓練的策略只能保證在這些仿真機器人上有效。

為了彌補這一 " 模拟到現實的差距 ",他們在模拟中結合使用了網域随機化和機器人上的kHz- 速率扭矩反饋控制

網域随機化通過随機化每個機器人的物理屬性,模拟策略可能需要運行的各種系統,從而彌合模拟與現實之間的差距。這有助于該策略在不進行任何額外微調的情況下,實現與物理機器人的 " 零接觸 "。

用 kHz 速率閉環扭矩控制來運行策略輸出,以補償執行器建模中的誤差。該策略對機器人與機器人之間的變化、表面摩擦力和外部推動力的變化都很穩健,在整個 Figure 02 機器人群中實現了可重復的仿人行走。

于是乎,就看到了 10 個機器人同一步态行走,沒有任何調整或變化。

接下來,他們計劃将這一技術擴展到數千個 Figure 機器人。

人形機器人越來越像人了

之所以這次選擇對機器人步态的改善,Figure 創始人也說了,這并非是他們的首要任務,只是之前網友吐槽得多了,他們最終目标是商業運送機器人。

By the way,今年伊始海内外的人形機器人都密集亮相,諸多大廠企業開始投身機器人的布局當中,這不今天同一天,vivo 宣布成立機器人 Lab。

在這些機器人持續整活之中,能夠看到他們舉手投足之間着實越來越像人了

且不說跟大爺一樣在公園遛彎、跑步、二人轉之類。

還學會了人類的一些空翻、托馬斯全旋等等雜技。

你還期待人形機器人哪些地方可以像人的?

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法!

—    —

最後一周!2025 年值得關注的 AIGC 企業產品 報名即将截止

下一個 AI" 國產之光 " 将會是誰?歡迎申報獎項!

本次評選結果将于 4 月 16 日中國 AIGC 產業峰會上公布。

一鍵星标

科技前沿進展每日見

關于人形機器人優雅漫步,強化學習新成果!獨角獸Figure創始人:之前大家吐槽太猛就分享完了,您有什麼想法可以聯系小編(幸聽楓)。