VUI語音交互設計:三步打造任務導向型對話場景
設計任務導向型對話場景是一項關乎人類最自然的對話和AI最智能的技術結合的復雜而有趣的工作,希望這篇文章對從事語音交互產品設計的同學們有所幫助。
- 5月10日,微軟Build大會發(fā)布智能音箱Invoke,
- 6月6日,蘋果WWDC發(fā)布HomePod,
- 7月5日,上午10點,百度AI開發(fā)者大會發(fā)布DureOS開放平臺,
- 同一天,下午2點,阿里人工智能實驗室發(fā)布天貓精靈……
這個夏天,被人工智能驕陽炙烤著的智能語音交互市場,熱度可謂一路飆升。
語音交互的主要能力在于開放式domain的聊天型功能與任務導向的技能型功能。如果說快捷高效、輕松自然是語音交互的獨特優(yōu)勢,那么任務導向型功能就是這些優(yōu)勢的完美落點,一個量好的語音交互產品,自然是技多不壓身,能夠cover的domain多越好,能夠get的技能越強大越好。
那么,作為語音產品設計人員,如何以短平快的方式設計一個任務導向型對話場景呢?
當然,和傳統(tǒng)交互設計工作一樣,前期調研是很有必要的。你想設計的這個功能是否能滿足產品目標、是否具備相關技術和數(shù)據(jù)能力支持以及符合用戶實際需求?如果有兩個場景擺在你設計的智能音箱面前,一個是訂外賣,而另一個是星座速配,你會選擇優(yōu)先做哪個?
一旦確定了要設計某個場景,接下來就可以著手設計工作了。具體來說就是三個步驟:理清對話邏輯(Chat Flow)、設計語法(Grammer)以及設計應答 (Confirmation)。
第一步:對話邏輯——從哪里來,到哪里去?
如同圖形用戶界面以點擊-觸發(fā)為各個節(jié)點的交互邏輯,VUI也需要一從query到answer的流轉邏輯,將一個場景的對話流程流暢的貫穿起來。
假設你設計的對話場景是查詢空氣質量,請考慮在這番對話中可能出現(xiàn)的任何情況以及相應的反饋動作:
下圖展現(xiàn)了該場景可能的Chat Flow
即便是詢問天氣這樣看上去很簡單的對話場景,也可以設計出十分復雜的對話邏輯,根據(jù)該場景在你產品中的重要程度決定細節(jié)邏輯的粒度。
第二步:設計語法 ——用戶會對你說什么?
語法就是用戶輸入的指令集,對話設計者需要設計對話的意圖(Intent),以及盡量考慮用戶可能表達方式,將其中最核心、最常用的表達方式提取為指令集模板。設計的指令集越多越全面,對話覆蓋率就會越高。
想象場景還是查詢空氣質量,請考慮用戶會用怎樣的表達方式來提出自己的要求:
“幫我查詢空氣質量”
“北京空氣質量指數(shù)”
“今天PM2.5值是多少”
“我需要戴口罩嗎”
“今天的空氣怎么樣”
……
中華語言,博大精深,簡單的查詢空氣質量,就有茫茫多的問法。不過不用著急,你只需要提取一些最典型的句式,至于“么”“嗎”“呢”這些語氣詞,或者虛詞、助詞等,語義理解模塊(NLU)會幫忙泛化。
下圖為查詢空氣質量對話指令集,其中<place>和<time>是槽位(Slot)。Slot是NLU從用戶指令中抽取的關鍵信息點,NUL模塊通過這些關鍵信息及其取值定義(Slot-Value),理解用戶指令的具體要求。
第三步:設計應答——你要如何回答用戶?
語音交互中最主要的應答方式是TTS(Text To Speech),就是將設計者寫好的應答腳本,通過TTS引擎轉化為語音播放出來。應答帶給用戶最直觀的感受,應答的好壞,直接關系到語音產品的體驗。鑒于過長的語音內容會增加用戶的記憶負載,設計應答時應該盡量簡潔。同時,如果你的語音產品具備自己的個性特點,在應答時也請按照該特點的語言風格撰寫腳本,保持角色的一致性。
還是查詢空氣質量的例子,在第一步,設計對話邏輯的過程中,我們已經定義了該對話可能出現(xiàn)的幾類應答。分別是:
- A1.詢問用戶想查詢哪里的空氣質量
- A2.反饋沒有查到相關地區(qū)相關時間的空氣質量
- A3.根據(jù)空氣質量級別的優(yōu)劣反饋相應提示
接下來,你只需要在對話腳本(script)文檔里,發(fā)揮你強大的語言天賦,進行完型填空就可以了。
“script”有“撰寫電影腳本”的含義,而整個設計對話過程確實很像設計電影腳本,有來言有去語,通過問答的互動形式幫助用戶完成任務。
綜上所述,設計任務導向型對話場景是一項關乎人類最自然的對話和AI最智能的技術結合的復雜而有趣的工作,希望這篇文章對從事語音交互產品設計的同學們有所幫助。
作者:Rachel Hu,阿里云OS VUI交互設計師
本文由 @Rachel Hu 原創(chuàng)發(fā)布于人人都是產品經理。未經許可,禁止轉載。
?? 棒棒的~!
正在準備做語音交互功能,非常感謝,很有指導意義
贊贊噠
?? ??
請問對話指令集中的句型,[][][外面]有(霧霾|污染)嗎
1.[]代表詞槽
2.[外面]代表什么?
3.(霧霾|污染)()代表可選項
4.霧霾|污染 代表或
尖括號代表槽
[]代表可選語法 ()代表必選語法
想提問個問題,在最上面的流程圖中,按照地址>時間的順序設計流程是否合適?如果用戶先說時間的話,系統(tǒng)是否一致提示請告知地址……..?
其實也是可以的,流程的設計并非一成不變,只要按照合理的交互邏輯設計就好
哈哈,我也搞了篇vui+gui 的 方便加個微信否。
感謝~ 唯一一篇VUI的文章,多交流
哈哈 我也寫了一篇,不過沒牽扯技術,光設計
作者以后寫文章的時候,對于一些比較專業(yè)的術語,建議不要只是寫英文,最好有一個中文的解釋,因為英語名詞如果不是在這個行業(yè)做過的話理解起來會有偏差。
很好的建議