DoNews5月21日消息,今天召開的 2025 年 I/O 開發者大會上,谷歌推出了 Gemma 3n 端側多模態 AI 模型,可以在手機、平板和筆記本電腦上本地運行,處理音頻、文本、圖片和視頻多種數據類型。
Gemma 產品經理 Gus Martins 透露,Gemma 3n 可以在內存小于 2GB 的設備上運行,采用 Gemini Nano 同款架構,但性能表現更出色。他強調:“Gemma 3n 為設備端 AI 應用帶來了驚人的表現力。”
Gemma 3n 的最大亮點在于采用了谷歌 DeepMind 開發的 Per-Layer Embeddings(PLE)技術,顯著降低了模型的內存需求。盡管其參數量分別為 5B 和 8B,但內存占用僅相當于 2B 和 4B 模型。
谷歌宣稱,Gemma 3n 的內存占用分別低至 2GB 和 3GB。此外,通過 PLE、KVC 共享和高級激活量化等技術,Gemma 3n 在移動設備上的響應速度提升 1.5 倍,質量也優于 Gemma 3 4B 版本。
Gemma 3n 在非英語語言處理上也有突破,尤其在日語、德語、韓語、西班牙語和法語中表現優異,在多語言基準測試 WMT24++ 中,該模型得分高達 50.1%。
用戶無需任何設置,目前可通過 Google AI Studio 直接在瀏覽器中使用 Gemma 3n;開發者則可通過 Google AI Edge 集成本地功能,支持文本和圖像理解與生成,未來還將擴展更多能力。