IBM近日推出Granite 4.0系列企業級大語言模型,新一代模型采用Mamba-Transformer混合架構,在保持性能的同時大幅降低內存需求,有效減少了推理部署成本。該系列首發包括Small、Tiny、Micro三種規模的標準版和指令版,其中32B參數的Granite-4.0-H-Small在開源模型中表現卓越。
據悉,混合架構設計使模型在長文本輸入和高并發場景下內存需求降低70%。性能測試顯示,最小規模的Granite 4.0模型已明顯優于前代8B版本。該系列模型采用Apache 2.0開源協議,并獲得ISO 42001認證和加密簽名支持。
免責聲明:本文內容由開放的智能模型自動生成,僅供參考。

