AI
16시간 전
0
RoboMME는 장기적이고 이력 의존적인 로봇 조작 작업에서 기억 메커니즘을 평가하기 위한 대규모 표준화 벤치마크입니다.
이 벤치마크는 시각-언어-행동(VLA) 모델의 시간적, 공간적, 객체 및 절차적 기억 능력을 체계적으로 측정할 수 있도록 16가지 조작 작업으로 구성되어 있습니다.
또한, π0.5 백본을 기반으로 한 14가지 메모리 증강 VLA 변형 모델을 개발하여 다양한 기억 표현과 통합 전략의 효과를 비교 분석하였습니다.
실험 결과, 기억 표현의 효율성은 작업 특성에 따라 크게 달라지며, 각 설계는 서로 다른 작업에서 장단점을 보였습니다.
이 연구는 로봇 일반 정책의 기억 이해와 발전에 중요한 기준을 제공하며, 관련 코드와 영상은 공식 웹사이트에서 확인할 수 있습니다.