天眼查App顯示,近日,浪潮電子信息產業股份有限公司公開了一項名為“視覺語言模型訓練方法、設備、介質及計算機程序產品”的發明專利,專利號為CN202411719465.2。該專利涉及人工智能視覺處理技術領域,旨在通過創新的訓練方法提升視覺語言模型的圖像處理能力。
該專利的核心技術在于構建了一個層級式視覺特征庫,包括全局視覺特征、前景視覺特征和聚合視覺特征。在訓練過程中,利用視覺語言模型的視覺提示器進行層級式篩選,從而提高查詢示例圖像的效率和質量。此外,該技術通過計算關聯示例圖像與查詢圖像之間的相似性損失值以及圖像處理結果的處理損失值,來更新視覺感知模型的參數,實現對視覺語言模型的全局優化。
相較于傳統的局部模塊適配方式,這種全局優化策略能夠避免模型陷入局部最優,從而進一步提高圖像處理的質量。該技術的應用前景廣闊,有望在醫療影像分析、自動駕駛、智能安防等領域發揮重要作用。
浪潮電子信息產業股份有限公司表示,該專利的公開標志著公司在人工智能視覺處理技術領域取得了重要突破,未來將繼續加大研發投入,推動相關技術的商業化應用。
風險警告:本文根據網絡內容由AI生成,內容僅供參考,不應作為專業建議或決策依據。用戶應自行判斷和驗證信息的準確性和可靠性,本站不承擔可能產生的任何風險和責任。內容如有問題,可聯系本站刪除。