HMI設(shè)計島:車載語音之形象設(shè)計別有洞天
#本文為人人都是產(chǎn)品經(jīng)理《原創(chuàng)激勵計劃》出品。
提到語音助手你會想到什么?是小愛同學、天貓精靈、亞馬遜Alexa、還是蔚來NOMI?想必對于你來說,車載語音也不陌生。語音識別技術(shù)的發(fā)展日新月異,如今的我們,只要喚醒語音助手,就能實現(xiàn)一系列的操控指令,滿足我們身處駕駛艙內(nèi)的需求。
一、VUI概念解讀
1. VUI釋義及簡史
VUI(Voice User Interface)意為語音用戶交互界面,可以解釋為計算機或移動設(shè)備上的語音控制應(yīng)用程序。其發(fā)展歷史大概可以劃分為兩個階段/時期。
VUI第一個時期的出現(xiàn)標志是交互式語音應(yīng)答(Interactive Voice Response, IVR)系統(tǒng)的誕生,IVR系統(tǒng)可以通過電話線路理解人們的談話并執(zhí)行相應(yīng)的任務(wù)。
比如:我們撥打移動通信運營商10086或10010時,可以與出現(xiàn)的語音客服系統(tǒng)直接溝通,繼而查詢話費或套餐業(yè)務(wù)。語音客服系統(tǒng)除了在移動通信運營商中廣泛應(yīng)用,各類航空公司、銀行、酒店也紛紛普及。
我們現(xiàn)在所處的時期是VUI的第二個時期。現(xiàn)今市面上存在Amazon Echo、小米智能音箱、天貓精靈等語音助手,其部分型號僅能提供語音信息,與此同時,Siri、Google Now、Cortana等綜合了語音和視覺信息的App也同樣占據(jù)市場份額。
在我們所處的第二時期,雖然很多事情已經(jīng)可以被當前的語音助手處理,但同時還有很多事情語音助手無法完成,所以目前我們同時也處于下一階段的初期,可以盡情期待VUI發(fā)展的未來:當我們開著車行駛在路上,駕駛艙內(nèi)的車載語音助手根據(jù)我們每個人的喜好主動告知我們哪里的商場今天正在進行打折,哪家羅森目前還能買到經(jīng)常斷貨的小蛋糕;又或是當我們情緒不好,主動做出緩解我們情緒的行動或提供建議。
2. VUI設(shè)計師的工作內(nèi)容
一如互聯(lián)網(wǎng)UX設(shè)計師專注于用戶和App/手機之間的流暢體驗一樣,VUI設(shè)計師專注于與用戶和語音程序之間的交互體驗。
《語音用戶界面設(shè)計》一書中這樣說道:“VUI設(shè)計師思考的是在系統(tǒng)和終端用戶之間從開始到結(jié)束的整個對話過程。他們思考正在解決的問題以及用戶需要什么來達成他們的目的?!?/p>
VUI設(shè)計師的工作流程與UX通用設(shè)計流程類似,同樣包含:用戶研究、角色創(chuàng)建、原型設(shè)計、用戶流程創(chuàng)建、可用性測試和迭代設(shè)計。
但VUI設(shè)計和界面設(shè)計有很大的不同,語音交互設(shè)計師必須考慮語音的復雜性,需要了解人們對聲音的情感反饋和不同聲音之間的區(qū)別,涉及心理學、社會學、語言學等領(lǐng)域。
總結(jié)來說,VUI設(shè)計師的工作內(nèi)容分為四個部分,依次分別是:用戶研究、設(shè)計階段、場景數(shù)據(jù)收集、迭代優(yōu)化。
二、車載語音形象
沒有人格的語音用戶界面是不存在的。
——Cohen, Giangola and Balogh , 2004
正如Cohen, Giangola 和 Balogh 在《語音人機界面》中所說,如果你不給你的VUI設(shè)定人格化特征,那么你的用戶就會(腦補)。所以更好的做法是,我們在設(shè)計的初期就確定好自己的VUI人格。
好的VUI體驗,本質(zhì)上就是一次好的交談。而一場好的交談自然離不開交流的對象、內(nèi)容、語氣、音色等復雜性因素。車載語音形象可分為可視化部分(視覺部分)和聽覺部分。在大多數(shù)車載語音里,車載語音視覺通道是車載語音聽覺通道的理想載體,二者相互結(jié)合,相輔相成。
1. 語音視覺形象
1)車載語音視覺形象類型
語音形象分為傳統(tǒng)型(具象型)、抽象型、擬人型。
移動端手機、家庭音箱類語音多為抽象型形象,新勢力車多為擬人型形象,概念車多為傳統(tǒng)型形象。
這三種類型類型之間有分界線,但也會有一些融合。下面,我來介紹一下三種類型的具體特征和例子。
① 傳統(tǒng)型(具象型):二維、扁平、顏色簡單、動效簡單、聲音波型 、麥克風造型。
② 抽象型:三維、形狀不規(guī)則、色彩豐富、流動感、光效、球體、炫酷(例:Google語音助手Cortana)。
③ 擬人型:卡通、五官明顯、表情豐富、IP化、生動活潑(例:小鵬語音助手小P)。
2)車載語音視覺形象風格演化
車載語音視覺形象風格由傳統(tǒng)型向抽象型/擬人型演化。
通過下圖Siri的視覺變化過程圖,我們能夠明顯看到Siri的視覺形象由一開始的擬物化麥克風造型,逐步變?yōu)槌橄笮偷陌殡S著光效變化波動的圓。Siri是一個典型的由傳統(tǒng)型向抽象型演化的例子。
3)視覺類型占比
通過下圖我們可以看到傳統(tǒng)型、抽象型、擬人型語音視覺形象在移動端和車極端的大致占比。
可以發(fā)現(xiàn):在移動端目前占比最高的是抽象型視覺形象,在車載端,目前占有最高比例的是傳統(tǒng)型語音形象,隨著新能源車占有比例升高和科技的發(fā)展,這一數(shù)據(jù)也會在未來隨之變化。
擬人化的視覺形象是VUI的常見表現(xiàn)形式,但不是所有的VUI都需要擬人化視覺設(shè)計,比如Sir和Cortana的視覺形象就是一個活動的發(fā)光的圓圈。對于一個好的語音交互來說,擬人形象并不是必不可少的條件。
4)語音形象的多樣性
語音形象不僅限于展示語音的基礎(chǔ)狀態(tài)(喚醒聆聽態(tài)等),同時也體現(xiàn)播報態(tài)語音形象的多樣性。拓展方向為:
- 語音形象與不同形象結(jié)合;
- 語音形象與不同情緒、個性化(如生日)結(jié)合;
- 語音形象與不同智能場景結(jié)合(天氣、小憩模式)。
2. 車載語音形象設(shè)計流程
車載語音形象設(shè)計流程包含人格特征、表現(xiàn)層、基礎(chǔ)狀態(tài)、聲音設(shè)計幾個方向,每個方向又包含若干設(shè)計模塊。
- 表現(xiàn)層:形象設(shè)計、動效設(shè)計、顏色、表情;
- 聲音設(shè)計:音色、語調(diào)、語氣、話語節(jié)奏;
- 基礎(chǔ)狀態(tài):識別解析、喚醒聆聽、結(jié)果反饋。
3. 如何得到語音的人格特征
當我們著手VUI設(shè)計時候,我們需要得到符合自己項目品牌的語音助手人格關(guān)鍵詞。
我們可以在公司內(nèi)部開展workshop或去品牌4S店進行調(diào)研,得到語音關(guān)鍵詞,再根據(jù)用戶的使用場景逐個分析推導。VUI設(shè)計師創(chuàng)造的聽覺形象需要符合自身產(chǎn)品屬性。
4. 語音聽覺形象(兩組調(diào)研)
普羅大眾喜歡什么樣的語音聽覺形象呢?此處我們來看兩個國內(nèi)外團隊的研究結(jié)果。
第一份是來自于百度智能駕駛團隊投放在百度地圖活動專區(qū)的的調(diào)研結(jié)果,來自于3745份有效樣本,該團隊將聽覺形象細分為基礎(chǔ)屬性、性格特質(zhì)和聲音特質(zhì)三個維度,根據(jù)三個維度的調(diào)研喜愛結(jié)果,組成了四種具體語音形象,分別是:甜美女生、溫和御姐、活潑女孩和爽朗男性。
根據(jù)其調(diào)研結(jié)果,在基礎(chǔ)屬性中,喜歡女性聲音形象的人占據(jù)最多的人數(shù),大于80%的用戶青睞18-32歲的偏年輕的語音形象。超半成的用戶希望語音產(chǎn)品成為自己的助手,低于半數(shù)的用戶希望語音產(chǎn)品為主播/主持形象。
在性格氣質(zhì)層面,用戶偏好活潑、開朗的多血質(zhì)形象(依據(jù)心理學體液氣質(zhì)理論)。
在聲音特質(zhì)方面,用戶更喜歡甜美的音色和隨和親切的語氣。其次穩(wěn)重、細膩的性格特質(zhì)也被多數(shù)用戶所喜歡。
看了百度智能駕駛團隊有趣的調(diào)研結(jié)果,再讓我們看一下德國Michael Braun博士團隊的調(diào)研思路。
前期研究階段:Michael Braun設(shè)計了8種語音助手人格,包含“主導 / 順從”和“敵對 / 友好”幾個人際交流間的基本維度,并在 6 個駕駛場景(3 個與駕駛相關(guān),3 個與娛樂相關(guān))下,邀請 19 名非 HCI 專業(yè)人員分別與 8 名助手進行對話,了解他們對語音助手人格特征的需求偏好。
基于以上研究,Michael Braun對語音助手的人格特征設(shè)計進行調(diào)整,設(shè)計出 4 種新的人格模型,分別為朋友、傾慕者、阿姨、仆人。
現(xiàn)實場景駕駛實驗:實驗共邀請了 55 名年齡在 23-60 歲的被訪者者,其中有 45 名男性和 10 名女性,被訪者中超過一半的人在日常生活中使用過語音助手。
被訪者駕駛中級轎車在慕尼黑的某路段上開始測試,按照駕駛場景的順序,被訪者者分別與匹配到的個性化助手和默認人格助手交互完成兩次駕駛實驗。在每次駕駛實驗后,被訪者口頭評價本次交互體驗的好壞。
實驗結(jié)果分析:在用戶與助手人格匹配過程中,55 個被訪者里有 21 個與朋友人格匹配,16 個與仆人人格匹配,15 個與阿姨型人格匹配,3個與傾慕者人格匹配。
結(jié)論:
- 語音助手人格與用戶個性的正確匹配至關(guān)重要,如匹配到適合自己的助手人格時,能夠獲得更高的滿意度和喜愛度,相反則容易引起不滿。
- 非駕駛場景下(如娛樂場景),用戶更喜歡適合自己的個性化人格;安全相關(guān)駕駛場景下,默認人格更受青睞。
習典有言:“履不必同,期于適足?!币馑季褪钦f,每一個人的鞋子大小不必相同,關(guān)鍵是要適合自己的腳。
語音聽覺形象亦是如此,適合用戶的,才是最好的。每款汽車都有自己的用戶定位,作為VUI設(shè)計師,應(yīng)當根據(jù)自己產(chǎn)品的用戶人群,來選擇最合適的語音人格調(diào)研方法,才能得到最適合的語音聽覺形象。
此外,可能會有同學好奇,語音助手聲音是如何合成的?
方法之一是找聲優(yōu)錄上百條關(guān)鍵話術(shù),根據(jù)聲音的關(guān)鍵信息,提取出來,然后合成的。
三、謹防用戶“跌落恐怖谷”
當用戶在使用語音助手的時候,容易觸發(fā)一些不良體驗,例如:恐怖谷狀況。我們在進行VUI設(shè)計時,要避免陷入這一境地。那么,什么是恐怖谷理論呢?
恐怖谷理論:
恐怖谷理論由日本機器人專家森昌弘在1970年提出??植拦壤碚摰慕忉尀椋?strong>當我們看到一個和人類極為相似但不完全相像的事物時,我們會由衷地感到恐懼。例如上圖中位于谷底的僵尸,雖然同為人類外形,但本質(zhì)大有區(qū)別,于是引發(fā)我們的恐懼。
避免恐怖谷狀況的方法之一是在我們的設(shè)計中減少人類特征設(shè)計,或者使用卡通/動物形象。
四、結(jié)語
未來已來,將至已至。腦機接口、元宇宙,各類新名詞充斥著我們的生活,科技的發(fā)展速度超乎想象。
語音技術(shù)亦是如此,各家公司持續(xù)迭代自己的語音系統(tǒng),針對下一個世代的智聯(lián)網(wǎng)進行布局。我們應(yīng)做好準備,迎接智能時代新的設(shè)計挑戰(zhàn)。
References
- 《語音用戶界面設(shè)計:對化式體驗設(shè)計原則》
- https://zhuanlan.zhihu.com/p/78890262
- https://www.researchgate.net/profile/Michael-Braun-20
- https://zhuanlan.zhihu.com/p/78890262
- https://mp.weixin.qq.com/s/8Y8vj4NCeIJ2Oq5dWX626Q
作者:刃魚;公眾號:HMI設(shè)計馬克筆
本文由 @刃魚 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
本文為人人都是產(chǎn)品經(jīng)理《原創(chuàng)激勵計劃》出品。
題圖來自Pexels,基于CC0協(xié)議
Google語音助手Cortana?
sorry,寫錯啦,感謝指正!
差點就懷疑自己了,于是點開了win的Cortana看了一眼笑哭
我個人還是挺喜歡理想汽車那個,感覺很靈動
實習生的產(chǎn)品體驗報告
對于我們這種剛?cè)腴T的人來說還挺開眼的