PixelSmile: 세밀한 얼굴 표정 편집을 향하여

PixelSmile은 확산 프레임워크(diffusion framework)를 활용하여 얼굴 표정의 의미를 분리하는 새로운 접근법입니다.

대칭적 공동 학습(symmetric joint training)과 대조 학습(contrastive learning)을 결합해 표정 강도를 정밀하게 제어하며, 얼굴의 정체성(identity)을 견고하게 유지합니다.

이를 위해 연속적인 감정 주석이 포함된 Flex Facial Expression (FFE) 데이터셋과 평가용 벤치마크 FFE-Bench를 구축하여, 구조적 혼동, 편집 정확도, 선형 제어 가능성, 그리고 표정 편집과 정체성 보존 간의 균형을 평가합니다.

PixelSmile은 텍스트 잠재 공간 보간을 통해 자연스러운 표정 혼합(expression blending)도 지원하며, 세밀하고 연속적인 표정 편집에 탁월한 성능을 입증하였습니다.

댓글