久久精品欧美日韩精品/狠狠色婷婷久久一区二区三区/国产精品午夜无码av体验区/丰满人妻av无码一区二区三区/成人做爰A片免费看网站爱酱

全球最大甲骨文多模態數據集宣布開源,助力甲骨文智能算法開發

7月5日,在世界人工智能大會上,“數字甲骨共創中心”宣布將全球最大的甲骨文多模態數據集正式開源。該數據集包含一萬片甲骨的拓片、摹本,以及甲骨單字對應位置、對應字頭、對應隸定字以及辭例分組、釋讀順序等數據。基于該數據集,研究人員可開發甲骨文檢測、識別、摹本生成、字形匹配以及釋讀等方向的智能算法,助推甲骨文研究加速數字化和智能化。

據介紹,數字甲骨共創中心由安陽師范學院甲骨文信息處理教育部實驗室、騰訊SSV數字文化實驗室、騰訊優圖實驗室、中國社會科學院甲骨學殷商史研究中心、中國社會科學院考古研究所安陽工作站、廈門大學多媒體可信感知與高效計算教育部重點實驗室、鄭州大學漢字文明研究中心等單位共同發起建立,吸納了來自中國社會科學院古代史研究所、英國劍橋大學、法國高等研究實踐學院、日本立命館大學、美國羅格斯大學、加州大學洛杉磯分校等高校和研究機構的專業科研力量支持。

甲骨文是漢字源頭,也是迄今為止中國發現的年代最早的成熟文字系統,它記錄了商代政治、經濟、軍事、文化等諸多方面的內容,展示了中華民族的智慧和創造力,為古文字研究和傳承、中華文明探源以及中國上古史體系的構建提供了第一手史料。

但甲骨文研究存在眾多難點。甲骨自然損壞速度較快,保存、展示、利用不易,且出土甲骨都分散收藏于國內外。同時,甲骨文研究專業門檻高,近7成已發現甲骨文還尚未釋讀,也急需提升考釋效率。近年來,隨著AI技術的快速發展,探索AI與甲骨文研究相結合,成為了研究人員的解題思路。

高質量的AI算法則非常依賴高質量的甲骨文數據集。過往,業界的甲骨文數據集存在信息簡陋、標注信息較簡單以及單一數據集字數較少等問題,比如檢測數據集,只能把字摳出來,不知道字是什么;字符識別數據集,只能認幾百個字;因為專業知識缺乏,有些標注信息不完善等。這些也成為了甲骨文智能算法開發的一大掣肘。

此次開源的甲骨文多模態數據集集合了甲骨文數字化研究的最新成果。

一方面,該數據集吸收了當前業界最先進的甲骨文研究資料,包括劍橋大學博士秦培超發布的鏡元甲骨文字庫,該字庫考慮了人工智能標注需求的字庫進行了細粒度的異體字標識;以及清華大學黃天樹教授發布的《摹本大系》,得益于其具有大量甲骨片清晰字形,降低了標注的難度。

另一方面,AI相關技術的應用也為數據集的信息豐富提供了支撐。比如由騰訊優圖實驗室聯合安陽團隊開發的甲骨字檢測模型,可以對甲骨片上的字進行一個初步的標注;字形降噪與匹配模型,為檢索提供了最直接的方法;甲骨校重算法,可以實現拓片與大系摹本的配準,使得大系摹本可以直接輔助拓片的標注;同時雙方聯合打造的協同創新平臺,也大大提升了數據標注的效率。

此外,數據集專業復查以甲骨文信息處理實驗室的研究生為主力,充分融合了甲骨文知識和機器學習知識的專業知識,也大大提升了數據集在AI算法研究場景下的可用性。

值得一提的是,騰訊在剛剛啟動的探元計劃2024項目中,聯合數字甲骨共創中心發布甲骨文AI破譯需求,揭榜掛帥,期待與有技術儲備、有意愿共創、致力于AI助力甲骨文破譯的科研機構共同形成解決數字文化演示方案,助力甲骨文破譯。經過最終遴選評審的合作伙伴將獲得20萬元資助,一起共創甲骨文AI考釋破譯的新算法、新工具、新方法。

中國社會科學院學部委員宋鎮豪表示,甲骨文是中華文明的重要瑰寶,甲骨文研究不僅有助于揭示中國上古信史,還能為現代漢字由來和漢語研究提供標志性依據。通過AI技術的應用,有望加快甲骨文探析進程,解決長期困擾學界的疑難問題。希望更多的科研機構和專家學者加入到這一偉大事業中,共同拓展甲骨文研究工作新天地。

安陽甲骨文信息處理教育部重點實驗室負責人劉永革表示,甲骨文的研究對于中華文化的傳承和發展具有重要意義。數字化和人工智能技術為甲骨文的破譯帶來了新的可能性和機遇。我們期待與更多有志于此的科研團隊合作,利用先進的技術手段,進一步挖掘和解讀甲骨文中的豐富信息,促進歷史文化的傳承與創新發展。用人工智能等數字技術助力甲骨文考釋的需求有文法分析、釋文翻譯、辭例擬補、殘字補全、辭例輔助綴合等等,潛在的應用場景有包括古文字研究與考釋、漢文字研學與普及教育、甲骨文展覽及內容制作與傳播等。

廈門大學教授,國家杰出青年科學基金獲得者紀榮嶸表示,甲骨文數字化及多模態甲骨文數據集的發布為甲骨文的研究和傳承注入了新的活力,具有里程碑式的意義。這一創新舉措不僅將古老的甲骨文以精準的數字化形式得以保存,確保了文化瑰寶的永續流傳,更通過多模態數據集的方式,集成了拓片、摹本,辭例分組、釋讀順序等多重元素,為研究者構建了一個全面而深入的研究平臺。全球最大的甲骨文多模態數據集的發布,必將極大地推動甲骨文的跨學科研究,讓我們能更深入地探尋其背后的歷史脈絡、文化內涵和社會背景。同時,為公眾打開了一扇直觀而生動了解甲骨文的窗口,有力促進了中華優秀傳統文化的傳承與普及。

騰訊云副總裁、騰訊云智能負責人、騰訊優圖實驗室負責人吳運聲表示,人工智能正在給包括甲骨文研究在內的科研場景帶來新能量,以前所未有的方式推動科研工作的進展。作為前沿技術的探索者,騰訊不斷探索將人工智能技術深度應用于產業場景中,同時搭建開放的技術平臺,推動技術普惠。此次聯合數字甲骨共創中心開源全球最大甲骨文多模態數據集,我們期待有更多技術團隊能夠攜手共進,探索人工智能技術在更多場景落地,共同為甲骨文研究提供更多助力。

騰訊數字文化實驗室負責人舒展表示,守護中華文脈,煥活漢字源頭。用人工智能助力甲骨文“破譯”和活化利用,我們一直在探索,將“甲骨文AI破譯”納入探元計劃支持的創新探索型項目的定向命題。聯合數字甲骨共創中心發布甲骨文AI破譯需求,揭榜掛帥,期待與有技術儲備、有意愿共創、致力于AI助力甲骨文破譯的科研機構形成解決方案。經過遴選評審的共創伙伴將獲得資助,共創甲骨文AI考釋破譯的新算法、新工具、新方法。

近年來,騰訊持續探索數字科技與文化深度融合,運用前沿數字科技幫助文化遺產保護傳承。

2022年,騰訊SSV數字文化實驗室、騰訊優圖實驗室與安陽實驗室、廈門大學首度攜手,共建甲骨文開放創新平臺,用新一代數字科技助力甲骨文考釋研究與傳承活化,以可持續社會價值創新的方式實現“科技+甲骨文”的共創共益,融合智能化、網絡化、數字化的科技理念實現甲骨文考釋研究、展示傳承、活化利用的模式轉型升級。

2024年,合作團隊發布了“數字甲骨國際共創計劃”,依托“殷契文淵”研究平臺和“了不起的甲骨文”活化平臺及探元數字文化開放平臺,邀請甲骨文相關收藏機構、研究機構、文化機構、教育機構和社會力量等共建共享、共創共益。

最新文章
Copyright ? DoNews 2000-2025 All Rights Reserved