MiroThinker-1.7 & H1: 검증을 통한 중장비 연구 에이전트 지향

MiroThinker-1.7과 MiroThinker-H1은 복잡한 장기 추론 작업을 위해 설계된 연구 에이전트입니다.

MiroThinker-1.7은 구조화된 계획, 맥락적 추론, 도구 상호작용을 중점으로 하는 중간 훈련 단계를 통해 각 상호작용 단계의 신뢰성을 높여 다단계 문제 해결과 지속적 추론을 지원합니다.

MiroThinker-H1은 여기에 더해 지역 및 전역 수준의 검증 메커니즘을 도입하여 추론 과정 중간 결정들을 평가·수정하고, 최종 답변이 일관된 증거 사슬에 기반하도록 보장합니다.

이 모델들은 오픈웹 연구, 과학적 추론, 금융 분석 등 다양한 벤치마크에서 최첨단 성능을 달성하며, MiroThinker-1.7과 경량 버전인 MiroThinker-1.7-mini는 오픈소스로 공개되어 효율적인 연구 에이전트 활용을 가능하게 합니다.

댓글