daVinci-Env: 대규모 오픈 SWE 환경 합성
OpenSWE는 소프트웨어 엔지니어링 에이전트 훈련을 위한 최대 규모의 투명한 실행 환경 프레임워크로, 12,800개 이상의 저장소에서 45,320개의 실행 가능한 Docker 환경을 제공합니다.
이 프레임워크는 64노드 분산 클러스터에서 다중 에이전트 합성 파이프라인을 통해 저장소 탐색, Dockerfile 생성, 평가 스크립트 자동화, 반복적 테스트 분석을 수행하며, 학습 효율을 극대화하는 난이도 기반 필터링 파이프라인도 포함합니다.
약 147만 달러의 투자로 구축된 OpenSWE는 9,000개 이상의 고품질 환경에서 13,000개의 엄선된 학습 궤적을 생성하였고, SWE-bench Verified 벤치마크에서 최첨단 성능을 기록하며, 수학적 추론 및 과학 벤치마크 등 도메인 외 과제에서도 유의미한 성능 향상을 입증하였습니다.
모든 Dockerfile, 평가 스크립트, 인프라가 완전 공개되어 재현성과 확장성이 뛰어나며, 연구자 및 개발자들이 대규모 소프트웨어 에이전트 학습 환경을 손쉽게 활용할 수 있도록 설계되었습니다.
