DoNews11月7日消息,據品玩引述 HuggingFace 頁面報道,微軟研究院聯手北京大學,共同發布了一款名為 PPTC 的大模型測試基準,可以用于測試大模型在PPT 生成方面的能力。
研究團隊表示,PPTC包含 279 個涵蓋不同主題的多回合會話和數百條涉及多模式操作的說明。研究團隊還提出了PPTX-Match評估系統,該系統根據預測文件而不是標簽API序列來評估大語言模型是否完成指令,因此它支持各種LLM生成的API序列。
研究團隊表示,當前大語言模型在生成PPT 內容方面主要存在三個方面的不足,包括多輪會話中的錯誤累積、長PPT模板處理和多模態感知問題。