$500 GPU가 오픈소스 AI 시스템을 사용하여 코딩 벤치마크에서 Claude Sonnet보다 뛰어남

ATLAS는 Adaptive Test-time Learning and Autonomous Specialization의 약자로, 14B 크기의 고정된 언어 모델을 단일 소비자 GPU에서 구동하며 74.6%의 LiveCodeBench pass@1-v(k=3) 성능을 달성하는 자가 학습 기반 코드 생성 시스템입니다.

핵심 기술로는 PlanSearch를 통한 제약 조건 기반 다양한 계획 생성, Geometric Lens를 이용한 에너지 기반 후보 평가, 그리고 PR-CoT(self-verified chain-of-thought) 수리 기법을 통한 반복적 코드 개선이 포함되어 있습니다.

이 시스템은 API 호출이나 클라우드 의존 없이 완전한 로컬 실행이 가능하며, 전기료만으로 저비용으로 운영할 수 있어 데이터 프라이버시와 비용 효율성 측면에서 큰 장점이 있습니다.

또한, K3s 쿠버네티스 환경에서 llama.cpp 서버를 패치하여 추론과 자체 임베딩 생성을 수행하며, 실패한 작업에 대해서는 모델이 직접 테스트 케이스를 생성하고 스스로 코드를 수리하는 혁신적인 자가 검증 메커니즘을 갖추고 있습니다.

향후 버전에서는 모델 교체, 렌즈 재학습, 병렬 처리 지원 등 확장성과 성능 개선이 예정되어 있어, 자가 학습 기반 AI 시스템 연구 및 실용화에 중요한 참고 자료가 될 것입니다.

$500 GPU가 오픈소스 AI 시스템을 사용하여 코딩 벤치마크에서 Claude Sonnet보다 뛰어남

댓글