ClawGUI: GUI 에이전트의 학습, 평가 및 배포를 위한 통합 프레임워크
GUI 에이전트 개발의 핵심 문제를 해결하는 통합 프레임워크가 등장했습니다.
ClawGUI는 강화학습 기반의 GUI 에이전트 훈련, 표준화된 평가, 그리고 다중 플랫폼 배포 기능을 하나로 묶었습니다.
이 프레임워크는 가상 환경과 실제 기기에서 병렬 학습을 지원하며, GiGPO와 Process Reward Model을 활용해 밀집 단계별 보상을 제공합니다.
평가 파이프라인은 6개의 벤치마크와 11개 이상의 모델에 대해 95.8%의 재현율을 기록해 평가의 일관성을 확보했습니다.
또한, Android, HarmonyOS, iOS 등 다양한 모바일 OS에서 12개 이상의 채팅 플랫폼을 통한 하이브리드 CLI-GUI 제어와 개인화된 메모리 기능을 제공합니다.
이 프레임워크로 훈련된 ClawGUI-2B 모델은 MobileWorld GUI-Only 벤치마크에서 17.1% 성공률을 달성해 기존 동급 모델 대비 6.0% 향상된 성능을 보였습니다.
ClawGUI는 GUI 에이전트 연구와 실용적 적용 사이의 간극을 줄이는 데 중요한 역할을 할 것으로 기대됩니다.
통합된 훈련, 평가, 배포 환경을 제공함으로써 GUI 에이전트 개발의 새로운 표준을 제시했습니다.
