久久精品欧美日韩精品/狠狠色婷婷久久一区二区三区/国产精品午夜无码av体验区/丰满人妻av无码一区二区三区/成人做爰A片免费看网站爱酱

李開復回應大模型套殼LLaMA:受益于開源也貢獻開源

DoNews11月16日消息,針對近日零一萬物被質疑完全使用 LLaMA 架構,只對兩個張量(Tensor)名稱做修改,李開復在朋友圈進行了回應。

IT之家報道,李開復表示:“全球大模型架構一路從 GPT2 --> Gopher --> Chinchilla --> Llama2 --> Yi,行業逐漸形成大模型的通用標準,就像做一個手機 App 開發者,不會去自創 iOS、Android 以外的全新基礎架構。01.AI 起步受益于開源,也貢獻開源,從社區中虛心學習,我們會持續進步。”

創新工場董事長兼 CEO 李開復于 2023 年創辦了 AI 大模型創業公司“零一萬物”,該公司已推出 Yi-34B 和 Yi-6B 兩個開源大模型,號稱對學術研究完全開放,同步開放免費商用申請。

然而在 Yi-34B 的 Hugging Face 開源主頁上,開發者 ehartford 質疑稱該模型使用了 Meta LLaMA 的架構,只對兩個張量(Tensor)名稱進行了修改,分別為 input_layernorm 和 post_attention_layernorm。

零一萬物開源團隊總監 Richard Lin 回應稱,這一命名問題是開發人員疏忽導致,開發人員在代碼中進行了幾次重命名,以滿足實驗要求。但是開發人員“忘記將張量名稱修改回 LLaMA”,開發人員對此感到抱歉。

值得一提的是,原阿里首席 AI 科學家賈揚清吐槽國內某一新模型中用的其實是 LLaMA 架構,僅在代碼中更改了幾個變量名引發網絡熱議。在被指大模型回應并發布訓練模型過程后,賈揚清最新發文,表示開源領域“魔改”要不得。

15日,零一萬物官方對 Yi-34B 訓練過程進行了說明,表示大模型持續發展與尋求突破口的核心點不僅在于架構,而是在于訓練得到的參數。

標簽: 零一萬物
李開復回應大模型套殼LLaMA:受益于開源也貢獻開源
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2025 All Rights Reserved