發(fā)布時間:2025-09-16 來源:胡言亂道網(wǎng)作者:側(cè)臉也很美
近年來,機器人技術(shù)在硬件領(lǐng)域取得了顯著突破 —— 無論是 DARPA 機器人挑戰(zhàn)賽,還是首屆人形機器人自由搏擊表演,都展示了令人矚目的進展。然而,機器人的自主能力仍明顯落后于機器學習的發(fā)展步伐。
造成這一差距的關(guān)鍵瓶頸在于軟件層面:現(xiàn)有的機器人技術(shù)棧學習門檻較高,仍大量依賴 C/C++ 進行底層開發(fā),工具鏈分散且硬件集成復雜。相比之下,推動現(xiàn)代人工智能發(fā)展的生態(tài)系統(tǒng)以 Python 為核心,文檔完善、易于使用 —— 兩者形成了鮮明對比。
為應(yīng)對這些挑戰(zhàn),來自華為諾亞方舟實驗室,德國達姆施塔特工業(yè)大學,英國倫敦大學學院,帝國理工學院和牛津大學的研究者們聯(lián)合推出了Ark —— 一個基于 Python 的機器人開發(fā)框架,支持快速原型構(gòu)建,并可便捷地在仿真和真實機器人系統(tǒng)上部署新算法
Ark 與主流機器學習工作流深度兼容,能夠從仿真環(huán)境或?qū)嶋H機器人中采集和預(yù)處理數(shù)據(jù),并支持使用如 ACT、Diffusion Policy 等前沿模仿學習方法進行策略訓練。該框架采用類似 OpenAI Gym 風格的主接口設(shè)計,極大降低了機器學習研究者的上手門檻,便于集成與實驗。在架構(gòu)層面,Ark 使用基于網(wǎng)絡(luò)的 Python 節(jié)點實現(xiàn)發(fā)布 / 訂閱通信機制,同時也提供 C/C++ 工具以兼容高性能需求場景??蚣苓€內(nèi)置了對 ROS 的原生支持,包含底層控制、數(shù)據(jù)工具、可視化、系統(tǒng)辨識、移動底盤導航等多個核心模塊,并配備完整的文檔與實用示例。
圖 1: Ark 的整體框架
論文鏈接:https://arxiv.org/pdf/2506.21628代碼鏈接:https://github.com/Robotics-Ark教程鏈接:https://arkrobotics.notion.site/Ark-Home-22be053d9c6f8096bcdbefd6276aba61
圖 2: Ark 目前的下載量
Ark 框架概述
為推進具身智能研究的發(fā)展,Ark 應(yīng)運而生。該框架致力于與典型機器學習工作流深度整合,使用戶能夠快速構(gòu)建原型并將其部署至物理機器人。其設(shè)計秉持三大理念:
(D1)兼容主流機器學習生態(tài)
Ark 提供與廣泛使用的機器學習庫一致的用戶接口,降低機器學習背景研究者參與機器人開發(fā)的門檻,彌補機器人學習系統(tǒng)在成熟度與標準化方面的不足。
(D2)支持仿真 - 實機無縫切換
Ark 著力打通模擬環(huán)境與真實系統(tǒng)之間的壁壘,既保障開發(fā)階段的安全性,也顯著降低從仿真遷移到實機過程中的復雜度和錯誤率。
(D3)以 Python 為中心,兼顧高性能需求
Ark 以 Python 作為核心開發(fā)語言,依托其豐富的生態(tài)系統(tǒng)支持快速迭代與實驗。同時,針對高頻任務(wù)(如底層運動控制),也提供了便捷的 C/C++ 接口擴展能力,確保關(guān)鍵模塊的執(zhí)行效率。
下文將具體介紹 Ark 的核心功能與實現(xiàn)特點。
Ark 網(wǎng)絡(luò)
模塊化是機器人軟件系統(tǒng)設(shè)計的一項基本原則:通過將系統(tǒng)拆分為數(shù)據(jù)采集、狀態(tài)估計、任務(wù)規(guī)劃與控制等獨立模塊,可有效提升可維護性和擴展性。Ark 框架將每個模塊實現(xiàn)為獨立的 Python 進程(稱為 “節(jié)點”),節(jié)點之間通過異步消息通道進行通信,采用靈活的發(fā)布 / 訂閱機制實現(xiàn)數(shù)據(jù)交換。用戶可通過形如 NODE_NAME/CHANNEL_NAME 的命名方式定義通道,并動態(tài)創(chuàng)建發(fā)布端和訂閱端。我們遵循 LCM 類型規(guī)范語言定義消息類型,每個消息通道通過名稱和消息類型標識。Ark 提供名為 ark_types 的消息類型庫,包含多種機器常用類型(如 joint_state_t 或 transform_t)。
當前版本中,Ark 使用 LCM 作為底層通信后端,其輕量化架構(gòu)和豐富的配套工具(如日志記錄、調(diào)試和內(nèi)省支持)特別適用于機器人系統(tǒng)中的數(shù)據(jù)記錄與開發(fā)調(diào)試。同時,網(wǎng)絡(luò)層被設(shè)計為可插拔結(jié)構(gòu),便于未來擴展如分布式訓練與推理等復雜機器學習工作流。
使用 LCM 的另一優(yōu)勢是易于集成 C/C++/Java 等底層語言。由于 Ark 節(jié)點通過 LCM 消息通道通信,其他語言編寫的腳本也可利用標準 LCM 接口進行網(wǎng)絡(luò)通信。這對于僅支持廠商提供的 C/C++/Java API 的硬件設(shè)備(如力反饋接口)非常有用。用戶可通過實現(xiàn)相應(yīng)的 LCM 發(fā)布 / 訂閱接口將設(shè)備接入 Ark。然而,基于 Ark 在仿真與真實環(huán)境間協(xié)調(diào)的架構(gòu)設(shè)計(后文討論),以 LCM 作為其他語言與 Python 之間的橋梁并非總是最佳選擇。為此,Ark 提供一系列工具和輔助函數(shù) / 類,幫助用戶直接將 C/C++ 功能封裝到 Python。
Ark 還提供以下功能:
Services:為需明確請求 - 響應(yīng)的操作(如機械臂標定觸發(fā))提供支持,基于 LCM 類型系統(tǒng)定義請求與響應(yīng)結(jié)構(gòu);Registry:作為輕量級的網(wǎng)絡(luò)協(xié)調(diào)與服務(wù)發(fā)現(xiàn)樞紐,支持運行時可視化與故障隔離;Launcher:允許用戶在單一 YAML 格式配置文件中定義整個網(wǎng)絡(luò),通過一次終端執(zhí)行自動啟動所有指定子進程。
觀測與動作通道
Ark 采用 Gymnasium(OpenAI Gym)風格的接口設(shè)計:reset () 方法返回初始觀測值和環(huán)境信息;step () 方法則返回下一步的觀測值、獎勵、終止 / 截斷標志以及信息字典。每個環(huán)境在初始化時通過一個字典結(jié)構(gòu)分別定義其觀測空間與動作空間所依賴的消息通道:觀測空間通過訂閱多個消息通道獲取數(shù)據(jù),動作空間則通過向指定通道發(fā)布指令來控制機器人。不同觀測通道可支持不同的采樣頻率,環(huán)境在每一步執(zhí)行時自動返回各通道最新的一條消息。這種設(shè)計使研究者能夠快速原型化不同的策略輸入輸出組合,靈活適配多種算法與任務(wù)結(jié)構(gòu)。
真實世界與物理仿真
Ark 的一大能力是通過單個配置開關(guān)在仿真與真實機器人之間切換(sim = True/False)。Ark 以分布式節(jié)點架構(gòu)把機器人與傳感器(無論真實還是仿真)都實現(xiàn)為獨立節(jié)點;仿真端由一份 YAML 配置驅(qū)動,使仿真與真實系統(tǒng)接口的節(jié)點保持一致,從而可以在仿真模擬和現(xiàn)實部署中輕松切換。
在仿真后端上,Ark 并不是綁定單一模擬器,而是提供后端抽象層以便按需對接。當前 Ark 已支持 PyBullet 與 MuJoCo,后續(xù)計劃集成 Isaac Sim 等;仿真 / 現(xiàn)實的切換和后端選擇全部通過 YAML 配置完成,Ark 自動初始化相應(yīng)驅(qū)動,保證消息模式、通道命名與執(zhí)行流程保持一致。
圖 2: Ark 使用統(tǒng)一配置文件來實例化反映真實世界部署的分布式模擬系統(tǒng)
機器人與傳感器驅(qū)動
Ark 雖然在用戶接口層面(如類 Gym 的交互方式)提供了標準化的設(shè)計,但整個框架在架構(gòu)上保持了高度的可擴展性。自設(shè)計之初,我們就以廣泛的機器人及傳感器兼容性為目標,致力于支持多樣化的硬件生態(tài)。與近年出現(xiàn)的某些僅針對特定機型(如 LeRobot、PyRobot)的框架不同,Ark 旨在支持更多的硬件,并通過多種靈活的對接機制實現(xiàn)通用化集成。
Python 驅(qū)動接口:
Ark 提供了抽象基類 ComponentDriver,用于統(tǒng)一硬件組件與框架的集成方式。用戶在實現(xiàn)具體驅(qū)動時,只需繼承該類并重寫標準抽象方法,例如傳感器的 get_data 或機器人的 send_command。每個驅(qū)動均可與 Ark 的 “仿真 - 現(xiàn)實” 開關(guān)無縫集成,系統(tǒng)會根據(jù)全局配置自動將消息路由到真實硬件或?qū)?yīng)的仿真節(jié)點。
C++ 驅(qū)動支持:
在很多實際場景中,仍然需要依賴 C/C++ 實現(xiàn)底層驅(qū)動,例如某些設(shè)備僅提供原生 C/C++ 接口,或需要高采樣率以滿足實時控制需求(如足式機器人的步行控制)。為此,Ark 提供基于 pybind11 的 C++ 封裝工具,使得僅具備 C++ 接口的硬件也能夠以與 Python 驅(qū)動一致的方式接入 Ark,在保持性能的同時實現(xiàn)系統(tǒng)一體化。
ROS–Ark 橋接:
目前 ROS 仍是機器人領(lǐng)域應(yīng)用最廣泛的中間件體系,部分機器人(如 ViperX 機械臂)僅提供基于 ROS 的官方接口。為兼容此類系統(tǒng),Ark 提供專用的 ROS–Ark 橋接驅(qū)動,可實現(xiàn) ROS topic 與 Ark 消息通道之間的雙向通信。用戶可在不改動原有 ROS 代碼的前提下,實現(xiàn) ROS 與 Ark 的混合運行,這也為從 ROS 逐步遷移至 Ark 提供了平滑過渡路徑。根據(jù)我們與多家機器人實驗室的實際使用反饋,目前橋接器主要支持 ROS 1;對 ROS 2 的支持將根據(jù)社區(qū)需求進一步評估和推進。
內(nèi)省與調(diào)試工具
機器人系統(tǒng)通常由多個進程構(gòu)成,模塊間耦合復雜,因此一套完善的可視化與調(diào)試工具對快速定位和解決問題至關(guān)重要。Ark 為此提供了以下核心工具:
Ark Graph:實時顯示系統(tǒng)中所有活躍節(jié)點、它們發(fā)布與訂閱的消息通道以及當前可用的服務(wù),幫助用戶快速理解系統(tǒng)拓撲和通信關(guān)系。Ark Plot:支持對任意數(shù)值型消息通道進行實時繪圖,可用于觀察變量隨時間的變化趨勢,例如整定控制參數(shù)或診斷傳感器數(shù)據(jù)行為。Ark Viewer:實時可視化任意基于 LCM 傳輸?shù)膱D像消息通道,適用于相機標定、運行監(jiān)控和圖像算法調(diào)試。
此外,Ark 選擇 LCM 作為通信中間件的另一個重要原因,在于其原生提供的調(diào)試與內(nèi)省工具套件。例如 lcm-spy 能夠以圖形化方式查看網(wǎng)絡(luò)中流通的消息,提供類似于 Wireshark 或 tcpdump 的抓包分析體驗,用戶可以查看各通道的詳細統(tǒng)計信息,包括接收消息數(shù)量、消息頻率(Hz)、網(wǎng)絡(luò)抖動(ms)等關(guān)鍵指標,極大增強了系統(tǒng)的可觀測性與調(diào)試效率。
圖 3: Ark 可視化調(diào)試工具
用例
本節(jié)將通過一系列典型用例,展示如何使用 Ark 快速構(gòu)建常見的機器人學習工作流。所有示例均提供完整代碼,以便讀者復現(xiàn)和實踐。
在仿真與現(xiàn)實之間切換
將訓練好的策略部署至真實機器人往往伴隨顯著的安全與工程化挑戰(zhàn),而許多現(xiàn)有框架缺乏端到端的一體化流程,導致解決方案分散、難以系統(tǒng)化和泛化。Ark 通過一層高度可配置的抽象機制,基于統(tǒng)一的 Python/C++ 驅(qū)動架構(gòu),實現(xiàn)了從仿真到真實系統(tǒng)的無縫部署。用戶只需在完成環(huán)境(包括機器人、傳感器、物體等)的統(tǒng)一定義后,于配置文件中切換 sim=True/False,即可切換至目標運行環(huán)境。
我們在 ViperX 300s 固定基座機械臂上進行了抓取 - 放置任務(wù)的實例驗證。整個環(huán)境通過一份 YAML 配置文件統(tǒng)一指定,包括物體的初始位置、相機與機器人的位姿以及物理參數(shù)。觀測值為當前關(guān)節(jié)位置指令,動作為目標關(guān)節(jié)速度。仿真和真實環(huán)境均使用同一人工編寫的專家策略進行控制。在向真實機器人遷移時,僅需修改一個配置變量 sim,Ark 便在內(nèi)部自動將消息通道從仿真驅(qū)動程序切換至物理硬件驅(qū)動,其余所有代碼及數(shù)據(jù)結(jié)構(gòu)均無需變更。
圖 4: 基于統(tǒng)一配置的 Ark 分布式仿真系統(tǒng)架構(gòu),通過 YAML 文件定義機器人、傳感器及組網(wǎng)參數(shù),實現(xiàn)與真實部署一致的多節(jié)點仿真,支持策略無縫遷移
模仿學習的數(shù)據(jù)采集
模仿學習通常需要大規(guī)模的高質(zhì)量演示數(shù)據(jù),目前常見的采集方式主要包括以下兩種:
徒手示教(Kinesthetic Teaching):操作者直接通過物理引導機械臂完成動作任務(wù)。這種方式直觀自然,但存在設(shè)備安全與人員操作風險;遙操作(Teleoperation):通過 VR 頭顯與手柄、游戲手柄等設(shè)備,在安全距離外對機器人進行控制。該方法避免了直接接觸,但可能受限于視覺反饋質(zhì)量和運動映射準確性,對操作者技能有一定要求。
得益于 Ark 高度模塊化的架構(gòu)和強類型消息通道機制,用戶可以靈活接入不同類型的示教接口。我們利用 LCM 提供的 lcm-logger 工具實時記錄所有通道的數(shù)據(jù)至日志文件。Ark 內(nèi)置從日志中提取數(shù)據(jù)并轉(zhuǎn)換為 CSV 格式的工具,并支持沿用環(huán)境中已定義的觀測與動作通道配置,從而確保數(shù)據(jù)格式在采集、訓練與最終部署階段完全一致。
徒手示教:
以 ViperX 300s 機械臂為例,操作者可直接牽引機械臂完成目標任務(wù),LCM 同步記錄完整的關(guān)節(jié)軌跡與系統(tǒng)狀態(tài)。盡管在該示例中相機未參與控制回路,但仍可用于錄制視覺數(shù)據(jù)以供后續(xù)分析。演示結(jié)束后,記錄的數(shù)據(jù)既可用于策略訓練,也可通過 lcm-logplayer 進行逐幀回放,這對于處理包含人體影像(可能引入視覺偏置)或復雜物理交互的任務(wù)尤為有用。Ark 還提供了一鍵重置服務(wù),例如將 “重置” 操作綁定至鍵盤按鍵,極大方便了連續(xù)多次示教與系統(tǒng)評估。
遙操作:
Ark 支持多種輸入設(shè)備,如 VR 控制器與游戲手柄(如 PS4 手柄)。在一種典型配置中,用戶通過 VR 控制器實時發(fā)送 6 自由度位姿指令,系統(tǒng)通過逆運動學(IK)節(jié)點將其轉(zhuǎn)化為關(guān)節(jié)速度目標;另一種配置則使用手柄直接控制機械臂末端位姿。整個數(shù)據(jù)采集流程由一系列可復用的 Ark 節(jié)點協(xié)同完成,包括手柄控制節(jié)點、環(huán)境轉(zhuǎn)換節(jié)點(將手柄信號轉(zhuǎn)為末端目標)、IK 解算節(jié)點(將位姿轉(zhuǎn)為關(guān)節(jié)指令),以及用于發(fā)布圖像和關(guān)節(jié)狀態(tài)的傳感器節(jié)點。憑借 LCM 強類型和通道隔離的特性,更換相機或控制器時無需修改其他模塊。采集完成后,用戶可使用相同的通道配置從日志中提取標準化數(shù)據(jù),直接用于訓練。操作者還可通過手柄的 “X” 鍵快捷保存當前軌跡并觸發(fā)機械臂復位至中立姿態(tài)。
圖 5: lcm-logger 通過記錄來自多種控制接口的演示實現(xiàn)高效的數(shù)據(jù)采集
模仿學習
在本節(jié)中,我們展示了若干實現(xiàn)模仿學習的應(yīng)用案例,重點介紹如何使用 Ark 進行數(shù)據(jù)采集、訓練和策略部署。我們將展示了兩種模仿學習方法:(i)Diffusion Policy,(ii)ACT,Ark 作為核心基礎(chǔ)設(shè)施,提供模塊化組件、標準化接口和實時通信機制,顯著簡化了從數(shù)據(jù)收集到策略部署的整個流程。
Diffusion Policy 實現(xiàn)與部署示例:
我們在 ViperX 300s 機械臂與 Intel RealSense RGB 相機上完成了推動任務(wù)(pushing)Diffusion Policy 實驗。該任務(wù)的觀測空間包括機器人關(guān)節(jié)位置及連續(xù)的 RGB 圖像流,動作空間為關(guān)節(jié)位置指令。在部署階段,系統(tǒng)完全復用了數(shù)據(jù)采集時的架構(gòu):僅將原本的 “手柄控制節(jié)點” 替換為 “策略節(jié)點”。該策略節(jié)點從觀測通道讀取圖像和關(guān)節(jié)狀態(tài),并通過同一動作通道發(fā)布目標末端位姿。由于執(zhí)行通路與采集階段保持一致,用戶無需修改任何底層基礎(chǔ)設(shè)施即可直接驗證學習到的策略。
圖 6: Viper X 300s 機械臂執(zhí)行擴散策略的連續(xù)動作序列
ACT 實現(xiàn)與部署示例:
除擴散策略外,我們還基于 OpenPyro-A1 人形機器人平臺實現(xiàn)了 ACT 方法的示例。通過 VR 設(shè)備進行遙操作,收集了包括 “衣服整理” 與 “物體接力” 在內(nèi)的多類任務(wù)數(shù)據(jù)。通過訓練得到的策略能夠生成精細且包含豐富接觸交互的操作行為,展現(xiàn)出較強的泛化與實物操作能力。
圖 7: OpenPyro 使用 ACT 策略執(zhí)行衣服整理和物體接力任務(wù)
移動機器人
許多現(xiàn)實任務(wù)(如設(shè)備巡檢)要求機器人能夠在環(huán)境中自主移動至多個目標點。實現(xiàn)該能力需同時解決兩個問題:構(gòu)建環(huán)境地圖(建圖)并在地圖中實時定位自身(定位),這一過程合稱為同步定位與建圖(SLAM)。當?shù)貓D構(gòu)建完成且定位穩(wěn)定可靠后,機器人即可通過路徑規(guī)劃算法實現(xiàn)導航。
我們在 Ark 中實現(xiàn)了一套完整的移動機器人導航流程:首先通過遙操作控制機器人運動,并利用機載 LiDAR 數(shù)據(jù)構(gòu)建地圖;建圖完成后,使用 A* 算法進行全局路徑規(guī)劃,并結(jié)合距離變換技術(shù)確保與障礙物保持安全距離;最后通過 PD 控制器跟蹤路徑點,生成差速驅(qū)動所需的輪速指令。
建圖:
為實現(xiàn)建圖與定位,Ark 提供了一套 “遙操作輔助 SLAM” 流程,包含兩個核心節(jié)點:遙操作控制器與概率 SLAM 模塊,兩者通過消息通道通信。用戶通過遙操作節(jié)點發(fā)送線速度和角速度指令,這些指令經(jīng) Ark 動作通道發(fā)送至底層控制器,轉(zhuǎn)換為左右輪速。同時,LiDAR 數(shù)據(jù)與控制指令被實時發(fā)送至 SLAM 節(jié)點,用于融合估計機器人位姿并構(gòu)建地圖。我們采用基于 Rao–Blackwellized 粒子濾波的 FastSLAM 方法:每個粒子同時維護位姿估計和一個占據(jù)柵格地圖,柵格概率取值從 0(空閑)到 1(占據(jù))。系統(tǒng)結(jié)構(gòu)如圖 8 所示。
圖 8:Husky 機器人在 Ark 工具支持下于廚房環(huán)境實現(xiàn) SLAM 建圖與導航
導航:
在已知地圖且能可靠定位的基礎(chǔ)上,機器人可進行運動規(guī)劃。我們集成 A* 算法作為全局規(guī)劃器。規(guī)劃器接收目標點位置和 SLAM 生成的占據(jù)柵格地圖。首先通過閾值將地圖二值化,再計算距離變換圖以獲取每個柵格到最近障礙物的距離,確保路徑滿足 “半車寬 + 安全裕量” 的避障要求。A* 輸出一條平滑的避障路徑,表示為一系列笛卡爾路標點 (x,y),并按設(shè)定分辨率進行下采樣以提高執(zhí)行效率??刂谱酉到y(tǒng)根據(jù)實時位姿和路徑點序列逐點跟蹤:先調(diào)整機器人朝向,再沿直線移動至當前路標,進入容差范圍后自動切換下一目標。最終輸出線速度和角速度,并轉(zhuǎn)換為差速驅(qū)動的輪速指令。
具身智能
大語言模型(LLM)與視覺 - 語言模型(VLM)顯著提升了機器人的高層推理能力。Ark 憑借其模塊化設(shè)計與 Python 優(yōu)先的架構(gòu),天然適合將 LLM/VLM 作為高層策略選擇器集成到機器人控制回路中。
我們在 Viper 機械臂上構(gòu)建了一個基于 LLM 的智能體系統(tǒng)(圖 9),采用 DeepSeek-R1 作為底層模型,遵循 “代碼即策略(code-as-policy)” 范式:將 “抓取”“按位置放置”“移除物體” 等操作封裝為可參數(shù)化的策略函數(shù)。這些函數(shù)組成策略庫供 LLM 調(diào)用,模型根據(jù)任務(wù)上下文從庫中選擇合適技能并生成代碼執(zhí)行。
Ark 將整個系統(tǒng)解耦為感知、語言推理與運動執(zhí)行等多個獨立節(jié)點。DeepSeek 被封裝為一個服務(wù)節(jié)點,接收結(jié)構(gòu)化提示詞(包含場景觀測、可用函數(shù)和任務(wù)描述)并返回推理結(jié)果。每一步?jīng)Q策中,感知節(jié)點將棋盤狀態(tài)、圖像等觀測數(shù)據(jù)發(fā)布到消息通道,經(jīng)整理后通過服務(wù)調(diào)用發(fā)送至 LLM 節(jié)點,觸發(fā)一次策略生成。
圖 9:Ark 框架通過集成 DeepSeek 大模型賦予 Viper 機械臂國際象棋對弈能力
未來工作和總結(jié)
展望未來,Ark 計劃重點發(fā)展兩大方向:一是強化強化學習(RL)基礎(chǔ)設(shè)施,通過原生集成 Stable Baselines3 和 RLlib 等主流框架,支持并行環(huán)境執(zhí)行,并提供統(tǒng)一的環(huán)境抽象接口,實現(xiàn)在仿真與真實機器人之間高效訓練、評估和部署 RL 策略;二是提升高保真仿真能力,在現(xiàn)有 PyBullet 和 MuJoCo 支持的基礎(chǔ)上,進一步引入域隨機化、可微物理等關(guān)鍵特性,增強策略的魯棒性和仿真到現(xiàn)實的遷移效果,同時與高性能仿真后端深度集成,構(gòu)建更精確、可擴展且功能豐富的模擬環(huán)境。
Ark 以現(xiàn)代化、模塊化和用戶友好的架構(gòu),致力于在機器人學與機器學習之間建立高效橋梁:既大幅降低了真實機器人部署的技術(shù)門檻,又保持了面向前沿研究的靈活性與擴展性。隨著仿真性能的提升、RL 生態(tài)融合的深化以及工具鏈的持續(xù)完善,Ark 有望發(fā)展成為支撐具身智能研究的重要通用平臺,推動機器人學習社區(qū)不斷向前邁進。
表 1:Ark 與同類框架的功能對比,紅色圓圈表示該框架不支持該特性