語音交互在車載場景中的應(yīng)用
汽車駕駛體驗(yàn)的智能化升級(jí)下,車載場景內(nèi)容的語音交互場景、產(chǎn)品形態(tài)都在不斷變更、不斷升級(jí)。而未來它究竟發(fā)展地怎么樣呢?讓我們拭目以待。
汽車駕駛體驗(yàn)的智能化升級(jí)
自動(dòng)駕駛技術(shù)可謂是當(dāng)今最為熱門的一個(gè)話題,同時(shí)也是人工智能技術(shù)實(shí)現(xiàn)落地的重要場景之一。目前我們距離機(jī)器全自動(dòng)駕駛技術(shù)的實(shí)現(xiàn)還有一定的距離。不過,在自動(dòng)駕駛技術(shù)完全實(shí)現(xiàn)之前,人工智能將會(huì)首先升級(jí)汽車的駕駛體驗(yàn)。本文將嘗試梳理語音交互在車載場景中的應(yīng)用,向讀者介紹目前智能駕駛艙和車載語音助手的現(xiàn)狀,以及未來的發(fā)展趨勢。
智能駕駛艙是一個(gè)基于人工智能技術(shù)實(shí)現(xiàn)的概念。它是車載場景中智能駕駛輔助與智能機(jī)械化功能控制的結(jié)合,主要應(yīng)用包括汽車娛樂,安全駕駛,自動(dòng)駕駛和智能導(dǎo)航。
智能車載助手是智能駕駛艙的核心應(yīng)用,用戶能夠通過語音與車輛交互。車載智能助手借助最前沿的人工智能技術(shù),為汽車賦予“智能”,使其能夠更好的理解駕駛者的需求并為其提供服務(wù)。 隨著技術(shù)的不斷發(fā)展,科幻電影中的場景正在變?yōu)楝F(xiàn)實(shí)。
市場規(guī)模
隨著信息技術(shù),智能系統(tǒng)以及互聯(lián)網(wǎng)的發(fā)展,以語音交互為主的智能駕駛艙概念正在全方面進(jìn)入應(yīng)用落地以及投產(chǎn)的高峰。
根據(jù)Analysys報(bào)告指出,中國的智能駕乘用車的市場占有率已達(dá)到了15%,這個(gè)數(shù)字也將隨著全球范圍內(nèi)國家政策的相繼推出而進(jìn)一步增長。根據(jù)不完全統(tǒng)計(jì),中國的智能駕駛艙市場規(guī)模有望在2020年達(dá)到1214億元,而其2016-2020年的年均增長率則可預(yù)計(jì)達(dá)到25%。
目前,國內(nèi)外企業(yè)普遍看好智能駕駛艙的市場前景,并已開始在產(chǎn)業(yè)鏈各個(gè)環(huán)節(jié)進(jìn)行布局,以在后續(xù)發(fā)展中搶占先機(jī)。不僅福特,豐田,本田等傳統(tǒng)汽車制造行業(yè)開始推出整車智能駕駛艙戰(zhàn)略,三星,谷歌,蘋果等高科技公司也開始發(fā)布服務(wù)于汽車制造商的智能駕駛艙解決方案
前沿技術(shù)
由于在駕駛過程中,駕駛員的手和眼睛都被任務(wù)所占據(jù),因此車載場景對(duì)于語音的免提交互功能有更高的要求。而人工智能技術(shù)恰恰能夠幫駕駛者實(shí)現(xiàn)與汽車之間的語音交互。
智能駕駛艙通過自然語言理解,語音識(shí)別,文字轉(zhuǎn)化語音(TTS),語義解析等技術(shù),將車載語音助手,智能車載多媒體中心和自動(dòng)化汽車安全維護(hù)系統(tǒng)相結(jié)合,以實(shí)現(xiàn)智能化駕駛體驗(yàn)。
語音交互:
可通過語音識(shí)別技術(shù)和文字轉(zhuǎn)語音技術(shù)將語音聲波轉(zhuǎn)化成文字信息進(jìn)行解析,之后再將解析生成好的內(nèi)容轉(zhuǎn)化文字信息傳達(dá)給駕駛員,從而實(shí)現(xiàn)語音交互。麥克風(fēng)陣列技術(shù)可以幫助語音識(shí)別系統(tǒng)在特殊的駕駛環(huán)境下降低特殊的噪音干擾,以提高語音識(shí)別的正確率。
語義理解:
自然語言處理技術(shù)會(huì)對(duì)識(shí)別到的用戶指令進(jìn)行解析,解析后通過對(duì)話管理系統(tǒng)檢索適當(dāng)?shù)幕貜?fù)內(nèi)容,再通過對(duì)話生成系統(tǒng)將答案生成。在車載場景下,可以通過任務(wù)型對(duì)話系統(tǒng)搭建對(duì)話流,通過限定意圖下的詞槽補(bǔ)全形式和追問內(nèi)容編輯,實(shí)現(xiàn)自然的多輪對(duì)話。
狀態(tài)識(shí)別:
以深度學(xué)習(xí)為基礎(chǔ),結(jié)合計(jì)算機(jī)視覺,語音識(shí)別等技術(shù)根據(jù)駕駛員的表情和聲調(diào)來判斷駕駛員的精神狀況并提醒駕駛員保持清醒,避免危險(xiǎn)駕駛。
通過學(xué)習(xí)掌握駕駛員的生活方式和喜好,根據(jù)不同的情況向駕駛員提出方案選項(xiàng),真正變成駕駛員在駕駛過程中得力的助手,實(shí)現(xiàn)駕駛員與移動(dòng)工具的自然交流。
場景與應(yīng)用
汽車駕駛艙的核心要素是便利,安全和愉悅。圍繞著這三個(gè)要素, 汽車駕駛艙引申出許多應(yīng)用場景,而其中正在被人工智能技術(shù)所賦能包括以下五類:多媒體娛樂,車輛控制,智能導(dǎo)航,駕駛行為監(jiān)控,車況監(jiān)控。
(由于智能駕駛艙雖涉及的相關(guān)汽車制造領(lǐng)域場景繁多,本篇文章只包含部分有應(yīng)用案例落地并投產(chǎn)的領(lǐng)域與場景,故并未囊括如芯片制造,傳感器監(jiān)控等熱門場景)
在多媒體娛樂方面:
播放音樂,廣播電臺(tái)或播客的能力是智能語音助理最常見的用例之一。 特別是在開車時(shí),人們喜歡聽一些音頻節(jié)目。 這為汽車制造商,娛樂場所和語音助理提供商提供了一個(gè)推廣車輛使用案例的機(jī)會(huì)。除了簡單的播放,暫停和切換歌曲等功能外,還有更多個(gè)性化的功能尚待開發(fā)。 例如,快速選擇要收聽的內(nèi)容,或播放音頻的指定內(nèi)容的一部分。
在車輛控制功能方面:
基本功能包括調(diào)節(jié)車內(nèi)空調(diào)溫度,調(diào)整車窗,調(diào)整后視鏡,甚至可以切換駕駛模式,變換檔位。智能車輛控制系統(tǒng)可以幫助駕駛者更加自如的掌控汽車,讓駕駛者將注意力集中在汽車駕駛的任務(wù)上,從而提高駕駛汽車的安全性。
不過,像變換檔位這樣的功能實(shí)現(xiàn)起來相對(duì)難度較大,需要一套新的,有效的交互設(shè)計(jì)方案,以確保新交互的安全性和有效性。
在智能導(dǎo)航方面:
語音交互只是一個(gè)實(shí)現(xiàn)功能的入口,系統(tǒng)會(huì)理解駕駛員的語音指令,并提供有效的導(dǎo)航服務(wù)。
除了被動(dòng)的幫助駕駛員提供導(dǎo)航服務(wù)之外,智能導(dǎo)航系統(tǒng)還可以為駕駛者提供目的地推薦和行程規(guī)劃的服務(wù)。導(dǎo)航系統(tǒng)將整合工作單位,餐廳,商場,游樂場所,以及旅游景點(diǎn)的數(shù)據(jù)信息,自動(dòng)為駕駛者安排行程規(guī)劃供駕駛者參考。汽車將會(huì)為其駕駛者量身定制生活規(guī)劃服務(wù),將便捷與高效的生活方式帶給其主人。
在駕駛行為監(jiān)控方面:
汽車可以通過對(duì)駕駛者面部狀態(tài)的識(shí)別而判斷其精神狀態(tài),在適當(dāng)?shù)臅r(shí)候提醒駕駛者打起精神,以避免交通事故的發(fā)生。
除了面部狀態(tài)識(shí)別之外,還可以對(duì)司機(jī)駕駛汽車的時(shí)長,駕駛行為表現(xiàn)等數(shù)據(jù)進(jìn)行分析。如果發(fā)現(xiàn)駕駛者的駕駛時(shí)間過長,或是頻繁出現(xiàn)壓線行駛和緊急剎車等情況,汽車也會(huì)及時(shí)的給予駕駛者語音反饋,使其保持清醒。
在車況監(jiān)控方面:
駕駛者在駕駛過程中可以隨時(shí)與汽車進(jìn)行交談并詢問有關(guān)車輛狀況的任何信息,包括汽車每個(gè)模塊的性能和狀態(tài),如車輪的胎壓,水箱的溫度,冷卻劑和機(jī)油的水平等。
實(shí)時(shí)的監(jiān)控可以幫助駕駛者發(fā)現(xiàn)汽車的問題,并及時(shí)的作出恰當(dāng)?shù)奶幚恚苊庖馔獾陌l(fā)生。
另外,當(dāng)汽車自己檢測到問題時(shí),會(huì)主動(dòng)以語音交互的形式提醒駕駛者。
產(chǎn)品形態(tài)
智能駕駛艙系統(tǒng)的產(chǎn)品形態(tài)分為三個(gè)部分:
- 汽車廠和汽車制造商,將先進(jìn)的技術(shù)應(yīng)用到汽車的駕駛艙中。
- 科技巨頭,為駕駛場景提供最尖端的語音交互解決方案和人工智能服務(wù)。
- 創(chuàng)業(yè)公司,開發(fā)各種智能駕駛相關(guān)的便攜硬件和軟件服務(wù)。
這三類產(chǎn)品形態(tài)各有千秋,同時(shí)也都存在著各自的問題和短板。
傳統(tǒng)車廠:內(nèi)置智能系統(tǒng)
許多大型汽車制造商都在嘗試獨(dú)立開發(fā)自己的智能駕駛解決方案。在提高汽車性能的同時(shí),汽車制造商也在努力改善駕駛艙內(nèi)的體驗(yàn),以提高市場競爭力。
車廠開發(fā)的技術(shù)可以更好地與汽車兼容,然而,汽車廠沒有強(qiáng)大的相關(guān)研發(fā)能力,語音交互相關(guān)的人工智能技術(shù)并不是汽車廠強(qiáng)項(xiàng)。 因此,汽車廠開發(fā)的解決方案相對(duì)簡單,缺乏創(chuàng)新。
科技巨頭:平臺(tái)解決方案
目前,幾乎所有科技巨頭公司都在為汽車提供智能駕駛解決方案,例如,蘋果、谷歌、亞馬遜、Nuance、阿里巴巴和百度都為智能駕駛艙創(chuàng)建了平臺(tái)和操作系統(tǒng)。與大型科技公司的合作對(duì)于汽車制造商來說是一個(gè)很好的選擇。平臺(tái)和系統(tǒng)可以將其技術(shù)和服務(wù)集成到汽車專用操作系統(tǒng)中,為汽車駕駛員提供完整的智能駕駛體驗(yàn)。
技術(shù)巨頭憑借其先進(jìn)的技術(shù)研發(fā)能力和與汽車制造商的緊密合作,有效的優(yōu)化了相關(guān)產(chǎn)品和服務(wù)的質(zhì)量。 但是,為了快速搶占市場,科技巨頭公司通常更愿意提供通用類型的平臺(tái)服務(wù),很難為不同的車廠提供定制化服務(wù)。
初創(chuàng)公司:軟/硬件服務(wù)
有許多初創(chuàng)公司也在為汽車提供智能駕駛體驗(yàn)或相關(guān)服務(wù)。
初創(chuàng)公司提供的服務(wù)通常包括兩個(gè)部分:外部集成硬件與軟件應(yīng)用程序。常見的方法是,通過將外部硬件與汽車連接,在通過軟件服務(wù)來優(yōu)化汽車駕駛艙的性能,將普通汽車變成智能汽車。
這些初創(chuàng)公司的服務(wù)和產(chǎn)品非常靈活,通??梢栽谥付ǖ膱鼍昂吞囟ǖ男枨笾袨橛脩籼峁┒ㄖ苹姆?wù)。 然而,這類服務(wù)往往需要一些額外的操作和硬件設(shè)備的支持。另外,初創(chuàng)公司提供的技術(shù)解決方案與大部分汽車存在兼容性的限制。
結(jié)語
無論是汽車制造商,技術(shù)巨頭還是創(chuàng)業(yè)公司,都致力于為人們提供更安全,更易于操作和更多樣化的汽車駕駛體驗(yàn)。汽車制造商在安全性和易操作性方面具有優(yōu)勢,而技術(shù)公司在靈活性和多樣性方面做得更好。
從目前的發(fā)展趨勢來看,智能汽車駕駛艙的發(fā)展方向主要集中在三個(gè)方面:更大的屏幕,自動(dòng)化的控制界面,以及語音交互。
目前智能車載系統(tǒng)的功能仍然非常有限。在垂直應(yīng)用場景中,語音交互的體驗(yàn)和技術(shù)的穩(wěn)定性仍有很大的提升空間。隨著人工智能技術(shù)的持續(xù)進(jìn)步和5G網(wǎng)絡(luò)技術(shù)的普及,智能汽車相關(guān)產(chǎn)業(yè)的上下游市場將會(huì)迎來前所未有的發(fā)展。智能駕駛艙會(huì)與自動(dòng)駕駛解決方案共同顛覆汽車行業(yè),而作為功能體驗(yàn)入口的智能車載助手必將在未來幾年中成為語音交互,自然語言理解等人工智能技術(shù)的重要落地場景。
本文由 @單贏 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!