AI
16시간 전
0
PixARMesh는 단일 RGB 이미지로부터 3D 실내 장면 메시(mesh) 복원을 수행하는 자동회귀(autoregressive) 모델입니다.
기존의 암묵적 거리 함수나 후처리 레이아웃 최적화 방식을 벗어나, 객체 배치와 기하학적 형태를 통합 예측하여 한 번의 순전파로 일관된 고품질 메시를 생성합니다.
포인트 클라우드 인코더에 픽셀 정렬 이미지 특징과 전역 장면 문맥을 결합한 크로스 어텐션(cross-attention) 기법을 활용해 단일 이미지에서 정확한 공간 추론이 가능합니다.
이 모델은 컨텍스트, 자세, 메시 정보를 포함하는 토큰 스트림을 자동회귀적으로 생성하여, 경량이면서도 정밀한 메시를 산출하며, 합성 및 실제 데이터셋에서 최첨단 복원 성능을 입증하였습니다.
실용적으로는 3D 씬 재구성이 필요한 증강현실, 로봇공학, 게임 개발 등 다양한 분야에서 즉시 활용 가능한 아티스트 친화적 메시를 제공합니다.