撰文:李信馬
11月15日,阿里巴巴發布了三季度財報,其中阿里云業績表現亮眼,營收為296.1億元人民幣,同比增長7%,一掃此前幾個季度的低迷,經調整后EBITA利潤達到26.61億元,同比增長89%。
值得一提的是,這也是“AI含量”極高的一份財報,通篇對AI的重視躍然于紙上。過去一年,阿里云戰略轉向“AI驅動,公共云優先”,終于呈現成功的曙光。
自2009年算起,阿里云已經走過了15年的春秋。在云計算發展的初期,客戶多為業務類型相對簡單的中小企業;隨后,政府單位、傳統制造業企業也逐漸加入;而今,互聯網公司、科技企業成為云計算的重要客戶。企業上云也是循序漸進,例如阿里巴巴自身就是從淘寶、天貓周邊應用上云,之后核心交易系統、支付系統陸續遷移至云端,直至全面上云。
與此同時,云計算也從提供簡單的單一產品,到如今復雜的產品組合。早期上云可能僅需一個虛擬主機和一個公網IP,隨著需求的增加,客戶開始尋求更高級的服務。全球范圍內,大模型已經如火如荼的發展了兩年,云計算的客戶們,也在追求更先進的AI產品和服務。
在不久前的第七屆SD-WAN & SASE大會暨云網絡大會上,阿里云智能云網絡產品線技術架構負責人李星表示,AI會大力推動云計算的使用。
“比如我們在大規模訓練中需要依賴資源高度集中,集約化資源,無論是對電力、算力,還是數據的資源,越是集約化、大規模的使用,效率越高,AI依賴的特征,包括AI訓練依賴的特征,和今天的云計算是非常匹配的,云計算能夠非常好的滿足AI在訓練業務上對算力資源集約化發展、高效率運用的需求。”
而未來,隨著大模型的成熟和AI應用的普及化,AI推理對算力資源的使用將大幅度超過AI訓練,AI應用有在線化、服務化、數據化的訴求,這也將推動企業更大規模上云或更深度地去使用云。
網絡是云計算的重要組成和基礎設施之一,AI的發展也離不開網絡的發展。“比如AI業務的訓練過程,一定需要一個高性能、高帶寬、大規模的網絡。網絡的發展還是比較迅速的,比如Scale-out(橫向擴展)網絡里大規模的RDMA互聯,從幾百卡到千卡到萬卡,帶寬也是從百GB到現在的200G、400G,最新的一臺服務器網絡帶寬通過多卡疊加已經達到了3.2T,發展速度大幅超過我們原來面向以CPU為中心通用算力的網絡。”李星說道。
會上,阿里云智能集團資深總監、云網絡產品負責人孫成浩,分享了他對當下AI發展趨勢,和未來云網絡發展的看法。
阿里云智能集團資深總監、云網絡產品負責人 孫成浩
孫成浩表示,近期阿里云的增長,主要驅動力就是AI,包括基礎設施部分的消費和大模型應用的消費。對AI訓練需求的增長,帶動了全球IaaS的增長(主要體現在GPU的增長上)。
“我們自己從云網絡的角度來看,我們的產品服務比較好的滿足了大模型這一波市場增量的技術需求,解決了一些場景化的問題。比如上午提到的數據傳輸,在大模型卡資源比較稀缺或者說分布不均衡的情況下,通過高性能的云網絡可以進行一個跨域的數據傳輸和資源調度。
阿里云也基于大模型的場景對智算基礎設施做了許多創新,對全棧的軟硬件進行了相應的提升和優化,除此之外,云網絡面向大模型領域內的細分場景也提供了豐富的產品能力,例如訪問大模型服務提供了安全和隔離的私網連接的產品。
同時,我們和運營商之間會有很多合作,比如在跨境領域上,和聯通進行深度合作,用公有云的基礎設施加上運營商的資源服務客戶,以及服務海外客戶。利用AI的方式和手段,更好地為各行各業客戶應用做好基礎設施儲備。