로봇 학습 벤치마크
로봇 조작에 대한 표준화된 평가 — RLBench, LIBERO, CALVIN 등. 성공률, 작업 완료, 평가 지표.
빠른 찾아보기
인기 카테고리
빠른 태그
인기 태그
평가
조작에 대한 벤치마크
시뮬레이션
RLBench
PyRep에는 100개 이상의 조작 작업이 있습니다. VLA 평가에 널리 사용됩니다. 하위 집합에서 BridgeVLA 88.2%, InternVLA 95%+.
벤치마크 보기 → 시뮬레이션LIBERO
평생학습 벤치마크. 130개 작업, 공간/객체/목표 모음. RoboSuite. 95.9% SOTA(InternVLA).
벤치마크 보기 → 시뮬레이션CALVIN
언어와 비전으로 액션을 구성합니다. 긴 지평선, 언어 조건. RoboFlamingo의 강력한 기준선.
벤치마크 보기 → 실제 로봇Google 로봇 벤치마크
실제 조작. 700개 이상의 작업. WidowX, 다양한 실시예. 성공률, 다중 작업 평가.
벤치마크 보기 → 실제 로봇COLOSSEUM
대규모 실제 로봇 벤치마크. 다양한 업무, 환경. BridgeVLA 64%.
벤치마크 보기 →
연결된 자산
제안된 모델 및 데이터 세트
비교 가능한 지표
벤치마크는 사과 대 사과 성능 확인을 위해 그룹화됩니다.
실제 대 심 적용 범위
제어된 설정과 배포 중심 설정을 모두 평가합니다.
모델 매핑
각 벤치마크 경로는 호환되는 모델 제품군에 연결됩니다.
실행 지원
필요한 경우 데이터 캡처 및 평가 작업을 지원합니다.