3月20日,聲網亮相2025年中國家電及消費電子博覽會(AWE2025),正式推出對話式 AI 開發套件,此套件專為智能硬件開發者量身打造,旨在助力其快速構建 AI 實時語音交互產品,提升人機實時互動體驗。同時,聲網宣布已將對話式 AI 開發套件軟硬件全面開源。
對話式 AI 開發套件基于博通集成(Beken)的高性能 AI 芯片 BK7258 ,實現強大的端側音頻處理,同時深度融合了聲網的對話式 AI 引擎,讓智能硬件設備實現自然流暢的實時語音對話、智能停頓及打斷處理、以及超低延時響應,為開發者提供“對話式 AI + 智能硬件開發”一站式解決方案。
對話式AI開發套件方案架構圖
目前,聲網已將對話式 AI 開發套件的軟件、硬件全面開源。硬件側,將原理圖、位號圖等相關的硬件設計圖全面開放;軟件側,提供一整套面向開發者的開發工具箱,包括豐富的示例代碼和最佳實踐。開發者只需下載開源代碼,即可將對話式 AI 能力集成到自己的智能硬件設備中。1小時即可跑通 Demo,1天完成產品原型送樣,大幅縮短開發周期,降低開發門檻。
對話式AI開發套件
聲網對話式 AI 開發套件應用場景廣泛,從 AI 玩具到智能家居,可實現全場景適配,讓所有智能硬件開口說話。例如,AI 玩具、AI 教育硬件、AI 陪伴設備、家居語音助手、穿戴設備-個人助手等多種應用場景。
自然流暢、告別機械應答,定義下一代 AI 硬件交互體驗
AI 玩具、AI 機器人等智能硬件產品在實時互動時會面臨諸多技術挑戰,如背景噪音干擾語音識別的準確性,導致指令接收偏差;對話延遲破壞交流的流暢性,影響用戶體驗;模型缺乏靈活性,導致交互模式單一,難以根據實際場景做出動態調整。
針對這些問題,聲網對話式 AI 開發套件給出了有效的解決方案。其先進的語音活動檢測(VAD)技術,能夠精準識別語音信號,降低背景噪音的影響,確保語音識別的高準確率。實時語音合成功能實現了快速響應,讓交互更加流暢自然。智能打斷處理則賦予了設備靈活的對話能力,可根據用戶的表達實時調整,極大地提升了交互的適應性與流暢度,告別“機械式”應答,助力 AI 玩具和 AI 機器人實現更流暢、更迅速的交互體驗。具體來說聲網對話式 AI 開發套件具備5大優勢:
極致 AI 對話體驗
AI 與用戶的對話延遲最低可達 650ms,打斷響應低至 340ms,擁有近乎真人般的對話響應速度與節奏,極大提升交互的流暢性。精準的語音識別,能夠屏蔽 95% 的環境人聲及噪聲干擾,實現對話人聲的精準識別,確保在復雜環境下也能準確獲取用戶指令。
多模態交互體驗
提供豐富的接口配置,例如內置麥克風、攝像頭以及傳感器接口,還可提供文本、音頻、視頻和觸控等多種交互功能。通過 “聽、說、看、觸” 全維度交互形態,充分滿足親情陪伴、家居控制等不同場景下的多樣化需求。
主流 AI大模型支持
對話式 AI 開發套件對大模型實現廣泛兼容,支持通義千問、豆包、DeepSeek 等主流 AI 大模型服務,同時也可靈活接入自研大模型,為開發者提供豐富的選擇。
極速產品原型送樣
僅需 1 小時即可跑通 Demo,1 天便能完成產品原型送樣,極大地縮短了產品開發周期,降低開發門檻。同時,軟硬件開源的特性助力開發者快速完成從設計到上市的全流程。
低功耗設計
采用低功耗設計方案,支持超長待機,有效解決設備續航焦慮,為用戶提供更持久穩定的使用體驗。
全場景適配,讓所有智能硬件“開口說話”
聲網的對話式 AI 開發套件應用場景廣泛,從 AI 玩具到智能家居,可實現全場景適配,讓所有智能硬件開口說話。
在?AI 玩具領域,可支持動態調整游戲難度與劇情,保持趣味性,激發兒童創造力,還能即時解答兒童提問,將知識學習融入日常互動。
在?AI 教育硬件方面,能夠根據學生水平調整講解深度與節奏,實現自適應教學與個性化學習,還能進行語言能力訓練,實時糾音糾錯,模擬真實對話環境,提升口語表達。
對于?AI 陪伴設備,讓 AI 通過自然閑聊與情緒共鳴,成為部分人群的情感寄托,同時記錄用戶習慣,主動提醒用藥、作息,降低健康風險。
在家居語音助手場景中,支持連續對話與模糊指令,如 “調暗燈光,放點音樂”,還能通過復合指令實現跨設備協同,像 “觀影模式” 聯動燈光、投影儀等。
在穿戴設備-個人助手場景,可提供實時翻譯、實時字幕、實時會議紀要功能,并結合日程管理、任務提醒,實現工作流全鏈路智能化 。
賦能 Robopoet AI萌寵,開啟全新陪伴體驗
2024年 AI 玩具市場規模已達181億美元,權威機構預測,全球 AI 玩具市場將迎來爆發式增長,預計到2033年,市場規模將增長至600億美元。AI 玩具的快速發展為互動娛樂創造了新機遇,通過實時陪伴、沉浸式故事體驗和動態劇情開辟了全新的人機互動體驗。
專注于 AI 情感陪伴機器人的初創公司珞博 Robopoet,近日發布了一款口袋 AI 毛絨寵物 Fuzzoo。Fuzzoo 搭載其獨創的 MEM(多模態情感模型),能傾聽、感知并撫慰人心,具備養成屬性,提供實時個性化的陪伴。
借助聲網的對話式 AI 技術,Fuzzoo 大幅優化了 AI 交互的實時性和穩定性,使得這款 AI 陪伴機器人能夠進行自然流暢的對話,提供實時情感陪伴和個性化交互,從而為用戶帶來全新的陪伴體驗。
Robopoet 聯合創始人兼 CTO 潘雨楠表示,“聲網的對話式 AI 技術賦予了下一代 AI 玩具和機器人實時感知、思考、反應和交流的能力。憑借超低延遲響應、智能打斷、以及先進的語音處理能力,聲網讓人機互動變的更加自然流暢,并始終為互動體驗的穩定性和可靠性保駕護航。”
除此之外,目前已有數家客戶集成了聲網的對話式 AI 開發套件,相關智能硬件產品也即將量產發布。例如集賢科技最近發布的“靈語靈珠” AI 玩具,同步使用了聲網的對話式 AI 開發套件,實現了 AI 語音互動能力,助力其打造了更智能、更靈敏、更安全的 AI 玩具。
未來聲網將持續完善對話式 AI 開發套件,為更多智能硬件場景賦予實時互動能力,注入數字靈魂。通過不斷地優化實時互動體驗,使 AI 硬件不再是機械工具,而是有情感交互的生活摯友,滿足用戶多樣化需求,適應不同生活場景,推動智能硬件行業邁向人機互動新時代。