IBM, AI 성능 강화한 그라나이트 3.2 발표

IBM, Granite 3.2 모델 발표…새로운 CoT 기능 도입

IBM이 자사의 대형 언어 모델(LLM)인 Granite 3.2를 공개하며 실험적인 연쇄적 사고(Chain-of-Thought, CoT) 추론 기능을 추가했다. 이 모델은 기업을 위한 효율적인 인공지능 솔루션 제공을 목표로 하며, Granite LLM 라인의 빠른 업데이트를 이어가고 있다.

CoT 기능으로 심화된 문제 해결 능력 제공

CoT 추론은 LLM이 복잡한 문제를 논리적인 단계로 나누어 인간과 유사한 사고를 모방할 수 있도록 한다. 이로써 모델의 다단계 추론, 계산 및 의사결정과 같은 복잡한 작업 처리 능력이 크게 향상된다. IBM의 CoT는 Thought Preference Optimization 프레임워크를 활용하여 다양한 작업에서 성능을 유지하면서도 추론 능력을 개선한다.

예를 들어 "하늘의 색은 무엇인가?"라는 단순한 질문에 대해, 모델은 CoT 프롬프트를 사용해 하늘이 파랗게 보이는 과학적 이유까지도 포함하여 상세한 답변을 제공한다. CoT는 Granite의 8B 및 2B 버전에서 사용할 수 있으며, 개발자는 작업 복잡성에 따라 프로그램적으로 추론 기능을 활성화하거나 비활성화할 수 있다.

새로운 문서 이해 기능과 안전성 강화

IBM은 문서 이해 작업을 위한 새로운 20억 매개변수 Vision Language Model(VLM)도 도입했다. 이는 Docling 오픈소스 툴킷을 사용해 개발되었으며, 복잡한 문서 위주의 워크플로우를 처리하는 Granite의 역량을 강화한다. 해당 VLM은 PDF들을 처리하여 합성된 질문-답변 쌍을 생성하도록 설계되었다.

또한, IBM은 Granite Guardian 3.2를 통해 AI 안전성에 대한 지속적인 노력을 보여주고 있으며, 명령어 및 응답에서의 위험 탐지를 향상시키고 모델 크기를 30% 줄였다. 이 버전은 세밀한 위험 평가를 위한 "언어화된 신뢰도" 기능을 포함하고 있다.

그 외에 Granite는 TinyTimeMixers(TTM) 모델을 통해 예측 능력을 향상시켜, 금융 및 공급망 관리에 유용한 장기 예측을 가능하게 했다.

Granite 3.2 모델들은 모두 Apache 2.0 라이선스 하에 Hugging Face 및 기타 플랫폼에서 이용 가능하며, IBM의 AI를 기업들이 더 접근하기 쉽게 만들려는 미션을 지원한다.

출처 : 원문 보러가기

Leave a Comment