Google 로봇 벤치마크

실제 조작 평가. 700개 이상의 작업, 다양한 로봇 구현.

개요

Google 로봇 벤치마크는 700개 이상의 작업에 걸쳐 실제 물리적 로봇에 대한 정책을 평가합니다. WidowX 및 기타 실시예를 지원합니다. 측정항목에는 성공률, 다중 작업 성능 및 언어 기반이 포함됩니다. OpenVLA, RT-X 및 관련 모델을 평가하는 데 사용됩니다.

주요 결과

InternVLA-M1: 71.7%(WidowX), 76~81%(다른 실시예)
OpenVLA: 29개 작업에서 RT-2-X보다 16.5% 뛰어난 성능

Google 로봇 벤치마크

개요

주요 결과

관련된