DoNews8月28日消息,研究團隊在Phind 內部數據集上對 CodeLlama-34B 和 CodeLlama-34B-Python 進行微調之后發現,這兩款模型微調之后在 HumanEval 測試中的通過率均已超過GPT-4在3月份的成績。
本次發布的Code Llama是在Llama 2的基礎上,通過特定的代碼數據集進一步訓練而來,支持C++、Java、Python、PHP、Typescript(Javascript)、C#和Bash等眾多流行語言,依然是開源可商用。
Code Llama對編程專家和初學者都非常有用,無論是用專業的編程語言還是用自然語言(如普通話)來描述編程需求,Code Llama都能理解,并很好地生成相應的代碼或與代碼相關的解釋。這極大降低了開發門檻和效率。
Code Llama是Meta公司開源可商用大模型Llama 2的編程版本,據悉,Code Llama分為7B、13B和34B三個不同參數版本,可滿足不同的服務和延遲要求。每個版本的模型都使用了500B tokens與代碼相關的數據進行訓練。