Utonia: 모든 포인트 클라우드를 위한 하나의 인코더를 향하여
Utonia는 다양한 도메인의 포인트 클라우드 데이터를 하나의 자기지도 학습 기반 트랜스포머 인코더로 통합하여 표현 학습을 가능하게 하는 모델입니다.
이 모델은 원격 탐사, 실외 LiDAR, 실내 RGB-D 시퀀스, CAD 모델, RGB 영상에서 추출한 포인트 클라우드 등 서로 다른 센싱 특성과 밀도를 가진 데이터들을 일관된 표현 공간으로 학습하여 도메인 간 전이 능력을 향상시킵니다.
통합 학습을 통해 인지 능력이 개선될 뿐만 아니라, 로봇 조작과 같은 멀티모달 추론 및 비전-언어-행동 정책에도 긍정적인 영향을 미쳐 AR/VR, 로보틱스, 자율주행 등 다양한 응용 분야에 활용될 수 있습니다.
Utonia는 희소 3D 데이터의 기초 모델로서, 여러 도메인을 아우르는 범용 3D 표현 학습의 첫걸음으로 평가받고 있습니다.
