로봇 학습 벤치마크

로봇 조작에 대한 표준화된 평가 — RLBench, LIBERO, CALVIN 등. 성공률, 작업 완료, 평가 지표.

수집

시뮬레이션 벤치마크 트랙

재현 가능한 시뮬레이션 우선 평가를 위한 작업 모음입니다.

수집

실제 로봇 평가

구현된 배포 및 견고성에 초점을 맞춘 벤치마크입니다.

수집

언어 조건 작업

교육 기반 및 작업 구성을 강조하는 벤치마크입니다.

빠른 찾아보기

조작에 대한 벤치마크

환경 및 평가 초점별로 벤치마크 제품군을 필터링합니다.

시뮬레이션

RLBench

PyRep에는 100개 이상의 조작 작업이 있습니다. VLA 평가에 널리 사용됩니다. 하위 집합에서 BridgeVLA 88.2%, InternVLA 95%+.

벤치마크 보기 → 시뮬레이션

LIBERO

평생학습 벤치마크. 130개 작업, 공간/객체/목표 모음. RoboSuite. 95.9% SOTA(InternVLA).

벤치마크 보기 → 시뮬레이션

CALVIN

언어와 비전으로 액션을 구성합니다. 긴 지평선, 언어 조건. RoboFlamingo의 강력한 기준선.

벤치마크 보기 → 실제 로봇

Google 로봇 벤치마크

실제 조작. 700개 이상의 작업. WidowX, 다양한 실시예. 성공률, 다중 작업 평가.

벤치마크 보기 → 실제 로봇

COLOSSEUM

대규모 실제 로봇 벤치마크. 다양한 업무, 환경. BridgeVLA 64%.

벤치마크 보기 →

연결된 자산

제안된 모델 및 데이터 세트

비교 가능한 지표

벤치마크는 사과 대 사과 성능 확인을 위해 그룹화됩니다.

실제 대 심 적용 범위

제어된 설정과 배포 중심 설정을 모두 평가합니다.

모델 매핑

각 벤치마크 경로는 호환되는 모델 제품군에 연결됩니다.

실행 지원

필요한 경우 데이터 캡처 및 평가 작업을 지원합니다.

벤치마크에 대한 평가 또는 데이터가 필요합니까?

데이터 수집 및 실제 평가 지원을 제공합니다.

데이터 서비스 문의하기