MACRO: 구조화된 장기 컨텍스트 데이터를 활용한 다중 참조 이미지 생성 발전
MACRO는 다중 참조 이미지 생성 분야의 한계를 극복하기 위해 구조화된 장기 컨텍스트 데이터를 제공하는 대규모 데이터셋과 평가 벤치마크를 제안합니다.
MacroData는 최대 10개의 참조 이미지를 포함하는 40만 개 샘플로 구성되며, 맞춤화, 삽화, 공간 추론, 시간 역학의 네 가지 차원에서 다중 참조 생성 문제를 체계적으로 다룹니다.
또한, MacroBench는 4,000개의 샘플로 구성된 표준화된 평가 프로토콜을 제공하여 생성 일관성을 다양한 과제와 입력 규모에 따라 측정할 수 있도록 설계되었습니다.
본 연구는 MacroData로 미세 조정 시 다중 참조 이미지 생성 성능이 크게 향상됨을 입증하였으며, 교차 과제 공동 학습과 장기 컨텍스트 처리 전략의 시너지 효과도 확인하였습니다.
이 데이터셋과 벤치마크는 공개되어 연구자들이 다중 참조 이미지 생성 모델 개발에 활용할 수 있습니다.
