AI는 과학적 취향을 배울 수 있다
강화학습과 커뮤니티 피드백을 활용한 AI의 과학적 판단력 학습을 다룬 본 연구는, AI가 연구 아이디어의 잠재적 영향력을 평가하고 제안하는 능력인 과학적 취향(scientific taste)을 습득할 수 있음을 보여줍니다.
이를 위해, 70만 쌍의 논문 인용 데이터를 기반으로 높은 인용 논문과 낮은 인용 논문을 구분하는 Scientific Judge 모델을 학습하고, 이 모델을 보상 함수로 활용해 Scientific Thinker라는 정책 모델을 훈련시켜 영향력 높은 연구 아이디어를 생성하도록 하였습니다.
실험 결과, Scientific Judge는 GPT-5.2, Gemini 3 Pro 등 최신 대형 언어모델보다 우수한 성능을 보였으며, 미래 데이터와 미지의 분야, 동료 평가 기준에도 잘 일반화되었습니다.
본 연구는 AI가 인간 수준의 과학자에 한 걸음 더 다가갈 수 있는 중요한 진전을 의미하며, AI의 연구 기획 및 혁신 촉진에 실용적 가치를 제공합니다.
