OpenResearcher: 장기 심층 연구 궤적 합성을 위한 완전 개방형 파이프라인
OpenResearcher는 오프라인 환경에서 장기 연구 궤적(Long-horizon trajectories)을 합성하는 완전 개방형 파이프라인으로, 기존의 웹 API 의존 방식을 탈피하여 대규모 궤적 합성을 안정적이고 저비용으로 수행합니다.
검색, 열기, 찾기의 세 가지 명시적 브라우저 프리미티브를 활용하며, 1,500만 개 문서로 구성된 코퍼스를 기반으로 9만 7천 개 이상의 연구 궤적을 생성해냈습니다.
이 데이터를 활용해 300억 파라미터급 모델을 지도학습한 결과, BrowseComp-Plus 벤치마크에서 54.8%의 정확도를 달성하며 기존 모델 대비 큰 성능 향상을 보였습니다.
또한, 완전 오프라인 환경 덕분에 데이터 필터링, 에이전트 설정, 검색 성공과 최종 답변 정확도 간 관계 등 심층 연구 설계에 관한 체계적 분석이 가능하다는 점에서 실용적 가치가 큽니다.
파이프라인, 합성 궤적, 모델 체크포인트 및 오프라인 검색 환경은 모두 공개되어 있어 연구자와 개발자가 직접 활용하고 확장할 수 있습니다.
