智能座艙之語(yǔ)音喚醒
在越來(lái)越多場(chǎng)景下,我們可以看到智能語(yǔ)音的應(yīng)用,而其中,“語(yǔ)音喚醒”這個(gè)概念是必然要被提及的。這篇文章里,作者就對(duì)“語(yǔ)音喚醒”的定義、功能、問(wèn)題等方面做了解讀,一起來(lái)看看吧。
一、智能語(yǔ)音的發(fā)展趨勢(shì)
2017年,小愛(ài)同學(xué)、天貓精靈誕生,到2019年分別基于手機(jī)、家庭開(kāi)始打造以語(yǔ)音交互為核心,智能場(chǎng)景協(xié)同的護(hù)城河;
2020年智能音箱在國(guó)內(nèi)銷量一度達(dá)到1.51億臺(tái),成為繼手機(jī)之后的銷量最大的終端智能消費(fèi)品類。
消費(fèi)類智能語(yǔ)音終端的趨勢(shì):
- 單設(shè)備、單場(chǎng)景的指令交互向多設(shè)備、全場(chǎng)景的智能交互發(fā)展;
- 從單感官的交互方式向多感官的人機(jī)交互(多模)演進(jìn);
- 從功能性向情感陪伴的精神需求演進(jìn)。
二、什么是語(yǔ)音喚醒?
在連續(xù)語(yǔ)流中實(shí)時(shí)檢測(cè)說(shuō)話人特定語(yǔ)音片段。
三、語(yǔ)音喚醒的指標(biāo)有哪些?
喚醒率:用戶交互成功率。
誤喚醒:用戶未進(jìn)行交互,誤觸發(fā)的概率,一般以一天發(fā)生幾次計(jì)算。
響應(yīng)時(shí)間:用戶說(shuō)完喚醒詞后設(shè)備給出反饋的時(shí)間。
功耗水平:喚醒系統(tǒng)的耗電量如何,由于目前智能座艙應(yīng)用于新能源汽車,該指標(biāo)可不計(jì)。
四、語(yǔ)音喚醒能夠做的具體功能
oneshot:用戶無(wú)需等待喚醒反饋,即可發(fā)出工作指令。例:“你好百度播放音樂(lè)”,客戶端會(huì)在喚醒后直接啟動(dòng)識(shí)別以及語(yǔ)義理解等服務(wù)。
多喚醒:滿足用戶個(gè)性化的喚醒詞候選。例:百度的車,你可以用“你好百度”,用戶也可以自定義“你好騰訊”。
ZERO-SHOT:將常用指令作為喚醒詞,達(dá)到用戶無(wú)感知的喚醒效果。例:“打開(kāi)車窗”、“導(dǎo)航到天安門”作為喚醒詞,實(shí)現(xiàn)快速響應(yīng);這種喚醒策略,為了減少誤喚醒平呂,大多情況下都會(huì)限制喚醒詞范圍。
五、語(yǔ)音喚醒遇到的典型問(wèn)題
場(chǎng)景魯棒性:在環(huán)境嘈雜的情況下,通常會(huì)喚醒失敗或者誤喚醒,常見(jiàn)的車內(nèi)場(chǎng)景:播音場(chǎng)景、開(kāi)窗場(chǎng)景、高速場(chǎng)景、交談場(chǎng)景等,該類場(chǎng)景通常作為路試的必須場(chǎng)景。
相似詞誤喚醒:例:當(dāng)喚醒詞為“你好百度”,此時(shí)說(shuō)“你好小度”。
提前喚醒:當(dāng)喚醒詞為“你好百度”,此時(shí)說(shuō)“你好百”就喚醒。
詞嵌套:當(dāng)喚醒詞有“百度”“百度助手”,用戶準(zhǔn)備喊“百度助手”,“百度”被喚醒。
六、產(chǎn)品角度看語(yǔ)音喚醒
用戶體驗(yàn):語(yǔ)音喚醒作為語(yǔ)音交互的開(kāi)始,喚醒率極大的影響了用戶對(duì)語(yǔ)音的使用欲望,目前智能座艙的語(yǔ)音喚醒率普遍已經(jīng)實(shí)現(xiàn)≥95%,能夠給到用戶較為滿意的體驗(yàn)。
未來(lái)趨勢(shì):如今各家都在這點(diǎn)上做不斷地優(yōu)化,同時(shí)開(kāi)始向多模語(yǔ)音的方向發(fā)展,但是多模交互在當(dāng)前技術(shù)階段,存在支持范圍受限、誤喚醒率高、成本較高等問(wèn)題,語(yǔ)音喚醒詞在一段內(nèi),仍是市場(chǎng)主流的選擇。
未來(lái)隨著VPA、主題世界、大模型對(duì)話在車機(jī)上的應(yīng)用,喚醒詞可能會(huì)隨著語(yǔ)音風(fēng)格等有著更加有趣的變化。比如“你好,嬛嬛”,“華妃在哪”。
品牌價(jià)值:語(yǔ)音喚醒詞在一定程度上也對(duì)品牌的塑造有一定的價(jià)值,目前各家的默認(rèn)喚醒詞通常都為語(yǔ)音助手的名字“理想同學(xué)”、“小琪”、“小P”等等, 在日常語(yǔ)音使用中,不斷深化用戶對(duì)品牌的認(rèn)知。
本文由@加飯 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!