現如今,人們只需敲敲鍵盤,就可以讓AI寫作工具幫忙代寫論文、創作說唱歌曲或編寫劇本。然而,根據《Science》的報道,一項新研究表明,這些AI作品至少在目前仍帶有明顯的衍生色彩。
為了驗證這一觀點,研究人員開發了一款能夠衡量AI創造力的程序。倫敦大學學院研究AI創意性的計算機科學家Mirco Musolesi指出,評估創造力是“一個復雜且有趣的挑戰”,并認為這一新方法在解決語言新穎性問題這一方面表現出色。
自生成式AI和大語言模型問世以來,科學界對其創作能力一直存在質疑。盡管這些AI可以快速生成看似人類創作的文字,但部分學者認為其并未真正創新,只是簡單地重組訓練語料中的內容。批評者將其比作“隨機鸚鵡”。
然而量化這種創造力并非易事。科學家通常采取兩種方法:一是用計算機檢測抄襲跡象,但“無抄襲”不代表“原創性”;二是讓人類評分評估流暢性和原創性,但這一過程主觀且耗時。
對此,華盛頓大學的計算機科學家Lu Ximing和團隊開發了一款名為DJ Search的工具。它既具備客觀性,又能捕捉細微差異。該工具從AI輸出文本中提取短語片段,并在數據庫中查找相似內容。它不僅尋找完全匹配,還會識別語義相近的表達。借助AI算法分析詞義,它通過嵌入向量判斷同義詞。最終,其通過計算未匹配部分在文本中的占比來評估AI輸出的新穎性。
研究發現,人類在詩歌、小說和演講領域的表現明顯優于AI,分別高出80%、100%和150%。DJ Search還可以比較人類作品,例如《饑餓游戲》的語言原創性比《暮光之城》高35%。研究負責人Lu將AI類比為DJ:“它們像DJ混音音樂一樣拼接文本,盡管精彩,卻無法取代作曲家。”
加州大學洛杉磯分校的計算機科學家Nanyun Violet Peng建議,未來應評估整體敘事的原創性,而非僅限于語言層面。