DoNews4月8日消息,生成式AI正在席卷千行百業,而要拿到生成式AI的船票,「上云」,成為多數企業的第一選擇。
隨著生成式AI的崛起,亞馬遜自2023年以來頻頻出擊:去年宣布40億美元投資人工智能初創公司Anthropic后,近日繼續追加投資27.5億美元,已完成對Anthropic的40億美元的投資。
亞馬遜云科技作為全球云廠商的龍頭,其對于生成式AI的發展究竟到了何種程度?未來生成式AI的關鍵一步又要怎么走?4月2日,以「亞馬遜云科技攜手Anthropic 推進生成式AI創新」為主題的媒體溝通會在京舉辦,重點展示了一個月前發布的 Claude 3 系列大模型,并向媒體一一解答了相關疑問。?
01、“沒有一個模型可以適用于所有業務場景”
生成式AI從產品的發布到現在已有一年多的時間,亞馬遜云科技與眾多客戶開展了各方面的合作。他們認為,各行各業的場景千變萬化,雖然大模型的技術能力再強,但「沒有一個模型可以適用于所有業務場景」。
在亞馬遜云科技大中華區產品部總經理陳曉建看來,從模型能力到真正的運營生產之間,企業還需要增加很多輔助能力。
“盡管大模型非常重要,但僅靠大模型對你的生產是遠遠不夠的,企業需要一系列周邊的能力來正確、合理、安全、高效地使用大模型,這就是亞馬遜云科技一系列產品所提供的價值所在。”
在此背景下,亞馬遜云科技在生成式AI領域為客戶提供了三層架構,通過這三層,不同的客戶可以根據需求選擇不同層級的產品來支持他們的業務。
第一層,是生成式AI云基礎設施。
亞馬遜云科技為客戶提供了基礎算力,包括英偉達最新推出的G200芯片。除此之外,亞馬遜云科技還投入大量的力量來開發自研芯片,包括用于訓練的芯片Amazon Trainium,目前已經是第二代,推理芯片Amazon Inferentia也已經進入第二代。除此之外,還包括用于訓練和推理的平臺Amazon Sagemaker。
第二層,是模型?。
也就是隨著生成式AI出來的一些全新的產品,例如Amazon Bedrock,Amazon Bedrock通過一個模型平臺支持多種技術大模型,這是亞馬遜云科技提供的能力。
第三層,應用層。
亞馬遜云科技推出生成式AI助手Amazon Q,并與智能客服的產品Amazon Connect和商業智能服務Amazon Quicksight結合,還有面向編程開發人員的平臺Amazon CodeWhisperer等產品,支持不同客戶的業務需求。?
02、Claude 3,大模型新“卷王”
據了解,目前Amazon Bedrock提供各種領先的基礎模型供客戶選擇,其中既有知名的開源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非開源模型。
這其中,Anthropic Claude 3在各種認知任務上樹立了新的性能標桿。
Claude 3分為三個版本,分別為Haiku、Sonnet、Opus三款模型,簡單理解的話,就是中杯、大杯、超大杯,客戶可以根據自己的商業需求,從中選擇最合適的智能、速度和價格組合。
- Claude 3 Haiku,具有幾乎即時響應能力且最緊湊
- Claude 3 Sonnet,在技能與速度之間達到理想平衡狀態
- Claude 3 Opus,為處理高度復雜任務設計的最智能模型
?
分享會現場,亞馬遜云科技展示了Claude 3在處理數學問題、編程練習和科學推理等領域的能力。
圖片的解釋是多種應用場景都會遇到的問題,Claude3能夠對一項圖片文本進行識別,并對輸入的圖片進行問答。經過專業訓練,Claude3可以非常擅長理解,包括像圖片、圖表、圖形以及OCR掃描產生的圖像,并且它的理解速度優于業界其他多模態模型。
受數據、模型結構以及訓練算法等影響,幻覺的產生難以避免。Claude 3能夠降低幻覺。受在處理挑戰性開放問題(100Q Hard)上,Claude 3準確性明顯提升,并且減少錯誤答案。
亞馬遜云科技還展示了部分Claude 3應用場景,包括內容續寫、代碼輔助、電商商品描述撰寫以及長文本知識召回總結。
例如長文本知識召回總結,可根據提供的相關服務文檔,準確回答該服務在不同區域的價格且信息提取更完整;代碼輔助,能夠提供詳細了步驟的代碼步驟,幫助程序員在服務管理平臺Nacos中正確修改配置。
據了解,Claude 3現已具備多模態能力——Claude 3可以接收基于圖像的輸入,能力與其他前沿模型大致相同,并且延遲低于其他多模態模型(尤其是Claude 3 Haiku),包括:
針對常見的企業用例進行訓練:經過專門訓練,它們非常擅長理解圖片、圖表、圖形、技術圖解及光學字符識別 (OCR)。
速度優于其他多模態模型:評估顯示,Claude 3模型在圖像輸入能力方面與前沿模型相當,并且Claude 3 Haiku的速度優于所有能力相當的前沿模型。?
在兼具速度和智能要求的用例中表現出色:Claude 3模型兼具低延遲和強大的功能,因此在需要處理大量圖像、圖表、報告和其他視覺資產的企業用例中表現出色。
03、生成式AI的關鍵一步,要怎么走?
當前的云計算廠商,阿里云請老羅直播賣云、京東實時比價......各種價格戰反映出市場的白熱化程度。從目前來看,“一招鮮吃遍天”的時代已經過去,對于大廠而言,如果只做云、或者只做大模型、只做芯片都會存在短板。
從云基礎設施擴展到芯片和大模型的過程中,新的戰場已經開啟,在生成式AI的征程上,云廠商也有各自路徑。
回到企業需求的視角,企業使用基礎大模型至少有幾個核心訴求,例如數據安全與合規、易用的AI平臺和工具集。Amazon Bedrock提供對全球領先基礎模型的接入,并提供擁有知識庫、代理、Guardrails等各種便捷工具,同時確保數據隱私和安全,是企業構建和應用生成式AI的首選。?
此外,亞馬遜云科技擁有豐富的專業技術支持資源,包括架構師、產品專家、人工智能實驗室、數據實驗室、快速原型團隊、專業服務團隊,幫客戶打通應用生成式AI的最后三公里的工程化挑戰。
生成式AI領域接下來發展,最關鍵的一步是什么?陳曉建以生成式AI的三層架構為例做出了解釋。
首先,從最底層來看,芯片性能仍然落后于需求。雖然半導體芯片的發展已經非常快,但模型本身參數規模的擴大實際上遠超芯片的能力。“隨著規模的擴大,模型的未來將變得越來越復雜。作為基礎服務商,我們仍需關注的是如何實現這一目標,如何將底層能力、業務復雜度和大模型復雜度相匹配,使硬件發展趕上軟件發展規模。”
其次,從模型本身來看,其能力還有很多發展空間。“今天我們看到的模型可能代表了一個博士生水平,但是能不能做得更好?比如達到教授或者院士水平?包括亞馬遜云科技在內的諸多生成式AI供應商需要在未來持之以恒地去做模型能力方面的工作。”
在最上層與各行各業務相結合方面,陳曉建表示,亞馬遜云科技所提供的Amazon Q與BI(商業智能)服務Amazon QuickSight的結合,與Amazon Connect智能客服的結合,類似于SaaS解決方案非常多。“我們需要思考大模型如何更易用的方式和更低的成本的為人類社會各行各業中的應用提供更好的模型能力。”?
陳曉建還補充道,“我認為有句話表達得很好,生成式AI的iPhone時代已經到來。今天的演示讓我們了解到,生成式AI能完成多少以前無法完成的事情。但要真正做成這件事情,我相信不僅是需要亞馬遜云科技,整個行業都有大量的工作需要去做。”