InCoder-32B: 산업 시나리오를 위한 코드 기초 모델
InCoder-32B는 320억 개의 매개변수를 가진 최초의 산업용 코드 파운데이션 모델로, 칩 설계, GPU 커널 최적화, 임베디드 시스템, 컴파일러 최적화, 3D 모델링 등 다섯 가지 산업 분야에 특화된 코드 지능을 통합합니다.
이 모델은 8K에서 128K 토큰까지 점진적으로 확장되는 문맥 길이, 산업용 코드 데이터의 엄격한 전처리 및 중복 제거, 그리고 실행 기반 검증을 포함한 3단계 학습 파이프라인을 통해 하드웨어 의미론과 자원 제약을 고려한 복잡한 프로그래밍 문제에 대응합니다.
광범위한 평가 결과, 일반 프로그래밍 벤치마크에서 경쟁력 있는 성능을 보이는 동시에, 산업용 벤치마크에서는 오픈소스 모델 중 최고 성과를 기록하며 Claude Sonnet 4.6을 능가하는 결과를 나타냈습니다.
모델과 소스 코드는 HuggingFace와 GitHub를 통해 공개되어 있어, 산업 현장에서의 실용적 활용과 추가 연구에 기여할 수 있습니다.
