Omni-WorldBench: 세계 모델을 위한 포괄적 상호작용 중심 평가를 향하여

https://huggingface.co/papers/2603.22212

Omni-WorldBench는 4차원(4D) 세계 모델의 상호작용 중심 평가가 부족한 문제를 해결하기 위해 개발된 종합 벤치마크입니다.

이 벤치마크는 시간적 역학과 인과적 상호작용 효과를 다양한 시나리오에서 평가할 수 있도록 설계되었으며, Omni-WorldSuite라는 다양한 상호작용 수준과 장면 유형을 아우르는 체계적인 프롬프트 모음과, Omni-Metrics라는 에이전트 기반 평가 프레임워크를 포함합니다.

특히, 상호작용 행동이 공간과 시간에 걸친 상태 전이와 최종 결과에 미치는 인과적 영향을 정량적으로 측정하여, 기존의 시각적 충실도나 정적 3D 재구성 평가를 넘어선 4D 생성 및 상호작용 반응 능력을 중점적으로 검증합니다.

18개의 대표적인 세계 모델을 대상으로 광범위한 평가를 수행했으며, 현재 모델들이 상호작용 반응 능력에서 갖는 한계를 밝혀내어 향후 연구 방향에 실질적인 인사이트를 제공합니다.

본 벤치마크는 공개되어 4D 세계 모델링 분야의 발전을 촉진할 것으로 기대됩니다.

Omni-WorldBench: 세계 모델을 위한 포괄적 상호작용 중심 평가를 향하여

댓글