DoNews6月27日消息,據報道,日前,百度文心大模型3.5版本已內測應用,且在三大公開測試集上的評測中表現不俗,綜合能力評測得分超過ChatGPT、部分中文能力超出GPT-4。
據《中國科學報》報道,3月,百度新一代知識增強大語言模型“文心一言”公開邀測。該模型基于文心大模型3.0版本打造。時隔3個多月,文心大模型3.5版本的效果、功能、性能全面提升。
百度首席技術官王海峰介紹,與文心大模型3.0版本相比,3.5版本在效果、功能、性能上全面提升,這不僅表現在文心大模型的創作、問答、推理和代碼的提升上,還體現在訓練速度和推理速度的提升上。
對比數據顯示,文心大模型3.5的訓練速度提升2倍、推理速度提升17倍。這將大大提高模型迭代升級效率,大幅降低訓練及使用成本,進一步提升用戶體驗。
功能方面,文心大模型最大的一個變化是新增了插件機制。王海峰說,默認的內置插件“百度搜索”使文心一言具備生成實時準確信息的能力、長文本摘要和問答插件“ChatFile”支持超長文本輸入,等等。
王海峰表示,下一階段,文心一言將發布更多優質的百度官方和第三方插件,使用戶能夠更好地應用文心大模型。同時,文心一言將逐步開放插件生態給第三方開發者,幫助開發者基于文心大模型打造自己的應用。
王海峰透露,文心大模型3.5在基礎模型訓練中采用了飛槳最先進的自適應混合并行訓練技術及混合精度計算策略,采用多種策略優化數據源及數據分布,大大加快了模型的迭代速度,顯著提升了模型效果和安全性。
同時,百度文心大模型研發團隊創新了多類型多階段有監督精調、多層次多粒度獎勵模型、多損失函數混合優化策略、雙飛輪結合的模型優化等技術,使模型效果及場景適配能力進一步提升。
王海峰說,在此前的知識增強和檢索增強的基礎上,文心大模型3.5版本進一步提出了“知識點增強技術”。
具體而言,知識點增強技術首先是對用戶輸入的查詢、問題等進行分析理解,并解析生成答案所需要的相關知識點,之后運用知識圖譜和搜索引擎為這些知識點找到相應答案,最后用這些知識點構造輸入給大模型的提示。
顯然,知識點增強技術能為大模型注入更具體、更詳細、更專業的知識點,顯著提升大模型對世界知識的掌握和運用,使其完成各項任務的效果顯著提升。
此外,在推理方面,研發團隊通過大規模邏輯數據構建、邏輯知識建模、粗粒度與細粒度語義知識組合以及符號神經網絡技術,顯著提升文心大模型3.5在邏輯推理、數學計算及代碼生成等任務上的表現。
媒體注意到,目前面向公眾邀測的文心一言自5月23日以來,已升級到文心一言2.0,最新版本為6月21日上線的文心一言V2.1.0。該版本的更新信息有“上線官方插件ChatFile,可基于長文檔進行問答和摘要”“優化了模型在數學計算和作文創作的能力”等,其背后正是文心大模型3.5提供的服務。
王海峰稱,已獲得邀測資格的用戶可以隨時訪問服務,體驗文心大模型3.5的實際效果。比如,當前百度“如流”已經基于文心一言的能力上線了“智能總結”“智能洞察”“超級助理”等多個新功能,傾力打造企業辦公的統一入口、重塑業務流程、打破系統邊界,實現工作模式的范式變革。
再比如,在智能編程方面,百度智能編碼助手Comate已可根據自然語言的描述,生成對應的代碼片段,支持在代碼編輯區內根據注釋自動生成代碼,提升開發效率。