9月11日上午,2025 Inclusion·外灘大會在上海黃浦世博園區開幕。2024年圖靈獎得主、“強化學習之父”理查德·薩頓(Richard Sutton)發表主旨演講,他認為,人類數據紅利正逼近極限,人工智能正在進入以持續學習為核心的“經驗時代”,潛力將遠超以往。
(理查德·薩頓在2025外灘大會開幕式主論壇發表主旨演講)
薩頓在發言中表示,今天大多數機器學習的目標,是把人類已有的知識轉移到靜態、缺乏自主學習能力的 AI 上。“我們逐漸達到人類數據的極限,現有的方法不能生成新的知識,不適合持續學習,而持續學習對智能的效用至關重要。”他認為,我們正進入“經驗時代”,需要一種新的數據源,由智能體與世界直接交互中生成。這正是人類和其他動物的學習方式,是AlphaGo自我博弈下的“第37手”,也是近期AlphaProof在國際數學奧林匹克斬獲銀牌的路徑。
薩頓解釋,“經驗”指的是觀察、行動和獎勵,這三種信號在智能體與世界之間來回傳遞。“知識來自于經驗,可以從經驗中學習。一個智能體的智能程度,取決于它能預測并控制自身輸入信號的程度。經驗是一切智能的核心與基礎。”他同時指出,強化學習帶領我們進入了新的經驗時代,但要釋放全部潛力,還需要兩項目前尚不成熟的技術——持續學習(continual learning)和元學習(meta-learning)技術。
面對外界對AI帶來偏見、失業甚至人類滅絕的擔憂,薩頓認為,這種對人工智能的恐懼被夸大了,并且是被某些從中獲利的組織和個人煽動起來的。他以經濟社會的運行為例,只有當每個人有不同的目標和能力,經濟才能運行得最好。同樣,目標不同的智能體,可以通過去中心化的協作實現雙贏。
“人類最卓越的超能力,就在于比其他任何動物都更擅長協作。人類最偉大的成功在協作本身——經濟、市場與政府都是成功協作的產物,”薩頓表示,人工智能和人類繁榮將來自于去中心化協作。“協作并非總能實現,卻是世間一切美好事物的源泉,我們必須尋求協作、支持協作,并致力將協作制度化。”
展望人工智能的未來,他提出了四條現實的“預測原則”:第一,對世界應該如何運轉并沒有共識,但沒有哪一種看法能夠凌駕于其他;第二,人類將真正理解智能,并借助技術將其創造出來;第三,當今人類的智力水平,很快將會被超級人工智能,或者超級智能增強的人類遠遠超越;第四條,權力和資源會流向最聰明的智能體。基于此,他認為,在人類的發展進程中,人工智能的替代將是不可避免的。
放眼宇宙的歷史,薩頓將其分為四個時代:粒子時代、恒星時代、復制者時代和設計時代。他認為人類的獨特之處在于“把設計推向極致”,創造出能自己設計的事物,這也正是今天通過人工智能所追求的目標。人類至少是催化劑,是助產士,更是開啟宇宙第四大時代——“設計時代”的先驅。
“人工智能是宇宙演化的必然下一步,我們應以勇氣、自豪和冒險精神來迎接它。”薩頓表示。
9月10日-13日,2025?Inclusion·外灘大會在上海舉行,大會以“重塑創新增長”為主題,共設1場開幕主論壇、40多場開放見解論壇、2場全球主題日系列論壇、10多場創新者舞臺、10000平米科技展覽、5000平科技集市、科技智能創新大賽和1場科技人才招聘會,此外還有創投Meetup等特色環節,為參會者提供深度交流與合作的機會。