시뮬레이터가 아닙니다. 지속적으로 작동 가능한 실제 설정입니다.
우리의 맥락에서 RL 환경은 물리적 설정, 명확하게 정의된 작업 및 성공 기준, 안정적인 관찰 및 작업 공간, 결정론적 재설정 절차, 지속적인 로깅, 반복적인 시행착오에서 안전한 실행 등 완벽하게 지정된 실제 로봇 시스템입니다.
이를 통해 팀은 배포를 첫 번째 실제 테스트로 간주하는 대신 실제 세계에서 학습 기반 정책을 교육, 평가 및 반복할 수 있는 장소를 제공합니다.
실제 하드웨어, 실제 센서, RL, 평가 및 반복을 위한 실제 운영 지원을 기반으로 하는 지속적이고 학습 가능한 로봇 환경입니다.
우리의 맥락에서 RL 환경은 물리적 설정, 명확하게 정의된 작업 및 성공 기준, 안정적인 관찰 및 작업 공간, 결정론적 재설정 절차, 지속적인 로깅, 반복적인 시행착오에서 안전한 실행 등 완벽하게 지정된 실제 로봇 시스템입니다.
이를 통해 팀은 배포를 첫 번째 실제 테스트로 간주하는 대신 실제 세계에서 학습 기반 정책을 교육, 평가 및 반복할 수 있는 장소를 제공합니다.
작업, 성공 기준, 재설정 프로세스, 관찰 또는 작업 인터페이스를 잠급니다.
반복 가능한 초기화를 통해 수천 개의 에피소드에 걸쳐 동일한 실제 설정을 운영합니다.
관절 상태, 제어 명령, 시각, 촉각 또는 힘 신호 및 결과를 기록합니다.
실제 실패, 실제 엣지 케이스 및 회귀 추적을 사용하여 다음 버전에서 반복합니다.