在今年的聲網(wǎng)式A時機 RTE2025 實時互聯(lián)網(wǎng)大會上,聲網(wǎng)正式發(fā)布了對話式 AI 引擎2.0版本,對話該版本實現(xiàn)“優(yōu)雅打斷”的引預注升級,支持過濾無語義附和詞,擎讓讓 AI 更懂開口的更懂時機;支持預注冊聲紋識別,AI 能分辨是開口誰在講話;新增電話外呼功能,支持 SIP、支持PSTN 電話,冊聲通過 AI Studio 編排或一行代碼即可實現(xiàn),紋識穩(wěn)定性高。別電同時新版本還支持國內(nèi)外更豐富的話外呼 ASR 與 TTS 供應商,用戶可根據(jù)自己需求選擇想要的聲網(wǎng)式A時機語種和音色。
對話式 AI 引擎最新產(chǎn)品架構(gòu)圖
優(yōu)雅打斷2.0 讓 AI 更懂開口時機
在人與人對話中,對話經(jīng)常為了表示認同會發(fā)出“嗯”、引預注“啊”、擎讓“是的”等常見的語義附和詞,但在 AI 對話中,用戶并不希望因為自己無意中的一些語義附和詞,讓 AI 提前響應,這樣會給對話體驗造成比較割裂的體驗感,在教育、會議等很多場景也有很多詞需要提前過濾,不需要被 AI 響應。
基于此,對話式 AI 引擎2.0版對“優(yōu)雅打斷”功能進行了升級,不僅支持過濾對話中無語義的附和詞,自動識別“嗯”、“啊”等對話附和詞,避免誤觸發(fā)響應,還可以過濾自定義的文本,以適應不同業(yè)務場景需求。
預注冊聲紋識別 讓 AI 知道是誰在說話
在對話式 AI 中,多人同時與 AI 互動的場景將會越來越多,家居場景中,父母與孩子都會與 AI 互動,孩子不希望聊的內(nèi)容被爸爸媽媽發(fā)現(xiàn),所以希望 AI 能夠區(qū)分自己與父母的身份,在和 AI 對話時可以產(chǎn)出不同的內(nèi)容。
針對這樣的需求,聲網(wǎng)對話式 AI 引擎2.0 上線了預注冊聲紋識別,用戶僅需4-10秒鐘的有效語音注冊,可以快速建立聲紋模型,對話的過程也是實時進行比對,基本沒有任何體感延遲。且整個過程不存儲任何聲紋數(shù)據(jù)。通過提前注冊不同人的聲紋,不僅能讓 AI分辨出多說話人聲紋,知道是誰在說話。還可以針對不同任務的標簽輸出不同的對話策略與內(nèi)容推薦,無論是對于教育、情感陪伴類業(yè)務場景還是隱私保護都很有價值。
支持 AI 電話外呼 一行代碼即可撥打體驗
在“2025對話式 AI 場景熱力榜單”中 AI 客服位列Top6,僅次于 AI 語音助手、AI 硬件類熱門場景,而 AI 客服場景中電話是核心工具,電話也是目前全球范圍內(nèi)最通用的商業(yè)觸達用戶的接口。對話式 AI 引擎自發(fā)布以來,也收到了很多企業(yè)用戶對 AI 客服場景的需求。
聲網(wǎng)一直希望將對話式 AI 能力賦予到電話中,正式在2.0 版本中推出電話外呼功能,支持SIP/PSTN 電話,開發(fā)者可以通過聲網(wǎng)最新發(fā)布的對話式 AI Studio 進行工作流編排,通過 UI 手動配給就可以完成電話撥打,導入號碼,審核完成后,直接綁定外呼智能體,再點擊撥打。如果想在生產(chǎn)中部署,可以通過一行代碼撥打電話,非常便捷,且穩(wěn)定性可靠。
此外,2.0 版本還接入了國內(nèi)、海外更豐富的 ASR / TTS 供應商,開發(fā)者將擁有更多語種、音色可選擇,同時我們也支持第三方自研語音合成的接入,供應商定制、克隆等自定義音色也能上線。