語音交互項(xiàng)目總結(jié):基于用戶心理模型的語音交互設(shè)計(jì)

作者結(jié)合項(xiàng)目經(jīng)驗(yàn),從用戶心理模型出發(fā),分享了關(guān)于語音交互設(shè)計(jì)中遇到的一些問題與思考,希望給大家?guī)硇﹩l(fā)思考。
最近參與了“語音交互”的項(xiàng)目,實(shí)際上還是基于用戶語音輸入的圖形用戶界面。過程中有不斷的思考,所以總結(jié)一些遇到的問題和思考。
一、基于用戶心理模型的方法
1.用戶心理模型是什么?
簡單的說,用戶心理模型是指用戶對你的產(chǎn)品/功能/界面/元素/信息等等的解釋與認(rèn)知。
諾曼的《設(shè)計(jì)心理學(xué)1》里寫到,心理模型是存在于用戶頭腦中的關(guān)于一個(gè)產(chǎn)品應(yīng)該具有的概念和行為的知識(shí)。這種知識(shí)可能來源于用戶過去使用類似產(chǎn)品的經(jīng)驗(yàn),或者是用戶根據(jù)使用該產(chǎn)品達(dá)到的目標(biāo)而對產(chǎn)品的概念和行為的一種期望。
而人的認(rèn)知發(fā)展有3個(gè)特點(diǎn),同化、順應(yīng)、平衡。
- 同化:成功用原有的經(jīng)驗(yàn)和認(rèn)知去解釋和理解了新的外界刺激,原有認(rèn)知得到了強(qiáng)化。
- 順應(yīng):沒有成功用原有經(jīng)驗(yàn)和認(rèn)知去解釋和理解新的外界刺激,將根據(jù)新刺激調(diào)節(jié)原有認(rèn)知或重建新認(rèn)知。
- 平衡:同化與順應(yīng)是一個(gè)動(dòng)態(tài)平衡的過程。新的刺激出現(xiàn),會(huì)先用原有認(rèn)知去同化,成功即達(dá)到平衡,失敗則順應(yīng)達(dá)到新的平衡。
2.為什么基于用戶心理模型?
基于用戶模型可以更好的理解與分析用戶需求,也能讓設(shè)計(jì)更易用貼心。而區(qū)分同化心理模型和順應(yīng)心理模型有利于確定哪些需求需要重點(diǎn)做新手引導(dǎo),需要引導(dǎo)用戶建立順應(yīng)心理模型,哪些可以直接匹配同化心理模型,不用做多余的解釋。
3.怎樣建立用戶心理模型?
常用的研究方法有:問卷調(diào)查,任務(wù)分析,焦點(diǎn)小組和用戶訪談,用戶參與式設(shè)計(jì),用戶畫圖法,認(rèn)知走查,出聲思考。由于項(xiàng)目背景種種原因,我選擇比較簡單粗暴的類似品分析法。
二、建立語音交互心理模型
1.選擇參考
可根據(jù)項(xiàng)目情況建立選擇標(biāo)準(zhǔn),我的選擇標(biāo)準(zhǔn)是1.產(chǎn)品影響力/大廠出品 ?2.需求契合度,選擇的產(chǎn)品有:Google翻譯、微信、Siri、QQ音樂、淘寶、訊飛鍵盤、ios鍵盤、有道翻譯。
如圖,處于右上角的產(chǎn)品是需要重點(diǎn)剖析與思考的,在后面設(shè)計(jì)方案時(shí)影響權(quán)重也最大,因?yàn)闀?huì)最大幾率匹配到同化心理模型。
2.分析功能心理模型
經(jīng)過分析可得出,用戶對語音功能的心理模型有兩個(gè):1.相比鍵盤有時(shí)較方便的信息輸入方式 ?2.吩咐命令
3.分析形式心理模型
基于對功能的理解,再進(jìn)行形式上的分析,包括手勢,流程,頁面元素,反饋方式等,抽象出各個(gè)產(chǎn)品對語音交互所匹配的表現(xiàn)模型的共同與差異。
我根據(jù)語音交互的特點(diǎn),構(gòu)建了線性流程維度與交互原則維度,線性為觸發(fā)點(diǎn)-開始輸入-輸入中-輸入結(jié)束,交互原則為功能可發(fā)現(xiàn)性-操作可發(fā)現(xiàn)性-反饋,將每個(gè)產(chǎn)品的對應(yīng)表現(xiàn)的解構(gòu)元素整理出來。
可以發(fā)現(xiàn)在語言交互中,都重點(diǎn)考慮其交互手勢,反饋及新手引導(dǎo),手勢有點(diǎn)擊結(jié)束與按住兩種,對應(yīng)點(diǎn)擊手勢的都是圓形按鈕,對應(yīng)按住手勢的都是圓角矩形按鈕,但仍會(huì)加上文案提示,反饋形式有動(dòng)效、聲音、文案、手機(jī)震動(dòng)等多種,新手引導(dǎo)以文案為主。得到這些表現(xiàn)元素后,在設(shè)計(jì)方案時(shí),可根據(jù)具體的用戶場景及需求考慮是用按住好還是點(diǎn)擊好,反饋是只用動(dòng)效還是多種形式結(jié)合,最后得到適合的最優(yōu)解。
三、語音交互的重點(diǎn)
1.手勢
由于是基于手機(jī)圖形用戶界面的語音輸入,目前有兩種操作方式,一種是大家熟悉的微信按住錄音,關(guān)于微信為什么要用按住錄音的方式,知乎上有人說是借鑒的對講機(jī)心理模型 – 對講機(jī)說話需要按住實(shí)體按鈕,結(jié)束松開按鈕,具體我也沒有查到相關(guān)資料,但是微信的語音錄入交互已經(jīng)培養(yǎng)了大家的心理模型,形成了習(xí)慣。
另一種是Google翻譯,觸發(fā)即錄音,點(diǎn)擊按鈕結(jié)束,圓形按鈕與動(dòng)效很好地表現(xiàn)了點(diǎn)擊結(jié)束的操作示意。首先需要重點(diǎn)考慮的是手勢交互,手勢操作的可發(fā)現(xiàn)性與匹配可以減少用戶的誤操作和認(rèn)知學(xué)習(xí)成本。
2.反饋
由于語音錄入是一個(gè)持續(xù)性的輸入狀態(tài),所以反饋需要實(shí)時(shí)且明顯,為了讓用戶不存一絲懷疑地錄入信息,微信做了3個(gè)反饋:錄入動(dòng)效,按住效果,新的氣泡閃爍。ios原生鍵盤的語音則用了聲音反饋,我覺得這里的動(dòng)效反饋是很好的可創(chuàng)新設(shè)計(jì)的地方,在保證正確傳遞“正在錄音”的信息的同時(shí)可通過動(dòng)效傳遞產(chǎn)品的品牌感或增加趣味性。(在查資料的時(shí)候看到一篇關(guān)于智能音響設(shè)計(jì)的文章,里面提到不同情況的多種視覺反饋形式都很有趣。)
3.新手引導(dǎo)
在一個(gè)產(chǎn)品里,語音可以支持哪些功能用戶是沒有心理模型的,會(huì)默認(rèn)覺得支持所有功能,所以一開始需要做好新手引導(dǎo),告訴用戶可以做什么,怎么做。
4.控制感
自然的語音輸入應(yīng)該是讓用戶有控制感的,用戶決定什么時(shí)候開始什么時(shí)候結(jié)束,就如同人與人之間對話,我開始說,你認(rèn)真聽,我說完,你給予反饋,假如我說完,你還沒有給予反饋,需要我說我說完了嗯有點(diǎn)尷尬。所以習(xí)慣了微信的控制感后,再用QQ音樂的語音輸入后第一次會(huì)有點(diǎn)驚慌,怎么點(diǎn)擊就開始了,但是QQ音樂處理的好的是,會(huì)識(shí)別停頓自動(dòng)結(jié)束出結(jié)果,時(shí)間間隔基本是你把手機(jī)放回正常視線的時(shí)間間隔,這樣的結(jié)束體驗(yàn)是貼心的。
總結(jié)
雖然類似品分析的方法很簡單粗暴,但是也從中深挖到了一些有用的信息,知道以后接觸新的交互方式可以從哪些維度去思考,反思自己的思考方式與設(shè)計(jì)方法。感謝并希望看到最后的你給予專業(yè)的批評與建議~現(xiàn)在野蠻生長的我急需專業(yè)反饋~感謝你
參考文獻(xiàn)及文章:
《面向用戶心理模型的手機(jī)翻譯應(yīng)用交互研究》
《基于用戶心理模型的移動(dòng)互聯(lián)網(wǎng)音樂服務(wù)原型設(shè)計(jì)研究》
《基于用戶心理模型的移動(dòng)終端手勢操作研究》
本文由 @小靜靜 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

寫的真好!不過想問一下(在查資料的時(shí)候看到一篇關(guān)于智能音響設(shè)計(jì)的文章,里面提到不同情況的多種視覺反饋形式都很有趣。)請問這篇文章還有鏈接嗎?謝謝呀~
淺顯易懂,非常棒!??????