李开复回应大模型套壳LLaMA：受益于开源也贡献开源- DoNews

DoNews11月16日消息，針對近日零一萬物被質疑完全使用 LLaMA 架構，只對兩個張量（Tensor）名稱做修改，李開復在朋友圈進行了回應。

IT之家報道，李開復表示：“全球大模型架構一路從 GPT2 --> Gopher --> Chinchilla --> Llama2 --> Yi，行業逐漸形成大模型的通用標準，就像做一個手機 App 開發者，不會去自創 iOS、Android 以外的全新基礎架構。01.AI 起步受益于開源，也貢獻開源，從社區中虛心學習，我們會持續進步。”

創新工場董事長兼 CEO 李開復于 2023 年創辦了 AI 大模型創業公司“零一萬物”，該公司已推出 Yi-34B 和 Yi-6B 兩個開源大模型，號稱對學術研究完全開放，同步開放免費商用申請。

然而在 Yi-34B 的 Hugging Face 開源主頁上，開發者 ehartford 質疑稱該模型使用了 Meta LLaMA 的架構，只對兩個張量（Tensor）名稱進行了修改，分別為 input_layernorm 和 post_attention_layernorm。

零一萬物開源團隊總監 Richard Lin 回應稱，這一命名問題是開發人員疏忽導致，開發人員在代碼中進行了幾次重命名，以滿足實驗要求。但是開發人員“忘記將張量名稱修改回 LLaMA”，開發人員對此感到抱歉。

值得一提的是，原阿里首席 AI 科學家賈揚清吐槽國內某一新模型中用的其實是 LLaMA 架構，僅在代碼中更改了幾個變量名引發網絡熱議。在被指大模型回應并發布訓練模型過程后，賈揚清最新發文，表示開源領域“魔改”要不得。

15日，零一萬物官方對 Yi-34B 訓練過程進行了說明，表示大模型持續發展與尋求突破口的核心點不僅在于架構，而是在于訓練得到的參數。

久久精品欧美日韩精品/狠狠色婷婷久久一区二区三区/国产精品午夜无码av体验区/丰满人妻av无码一区二区三区/成人做爰A片免费看网站爱酱