VR還早呢,互聯(lián)網(wǎng)女皇看好的語音會(huì)是大機(jī)會(huì)嗎?

1 評(píng)論 6413 瀏覽 19 收藏 28 分鐘

眼下,怕是互聯(lián)網(wǎng)最糾結(jié)的時(shí)刻:智能手機(jī)帶來的人口紅利將盡,仿佛所有人們?nèi)粘I钪性撚械膽?yīng)用都已經(jīng)被開發(fā)出來、用戶們也同時(shí)失去了嘗試新鮮產(chǎn)品的動(dòng)力;與此同時(shí),向線下的突進(jìn)因?yàn)檫^重?zé)X沒有護(hù)城河的模式和諱莫如深看不懂的體制深水紛紛受阻,互聯(lián)網(wǎng)加了半天還是湊不上去;本來年初VR給諸位打了不少雞血、仿佛商用指日可待,但現(xiàn)在看來目前的終端too young、恐怕至多也才剛剛達(dá)到“塞班的階段”;而最近一直在提的內(nèi)容、直播、網(wǎng)紅等伴隨著政策的收緊、大平臺(tái)制霸和數(shù)據(jù)造假的曝光,看起來越來越不像是真正的風(fēng)口……除去以上的種種,一場(chǎng)資本寒冬讓投資機(jī)構(gòu)們徹底懵逼了,失去了往日的格局和耐心,歸根結(jié)底快沒錢了。那么問題來了,下一個(gè)機(jī)會(huì)在哪里呢?

恰在此時(shí),互聯(lián)網(wǎng)女皇來了,最新的年度趨勢(shì)報(bào)告十分之一的篇幅給了“語音”。女皇陛下是這么說的:語音正在被重塑,成為人機(jī)交互的新范式,在過去75年里,每10年就有一次人機(jī)交互的重大革新,人類對(duì)機(jī)器的操作,從物理手柄按鍵,到物理鍵盤鼠標(biāo),再到觸摸屏,而現(xiàn)在語音成為了重要的交互方式。她的案例是Amazon的硬件:Echo。其內(nèi)置了Amazon Alexa語音助手,目標(biāo)是占領(lǐng)家居、汽車、手機(jī)的麥克風(fēng),還能智能購物。這款產(chǎn)品銷量已突破400萬臺(tái)。女皇更是大膽指出:語音拐點(diǎn)已經(jīng)到來,在2015年智能手機(jī)銷量下滑之后,Echo銷量或?qū)Ⅱv飛。(以上引自《超過十分之一的篇幅給語音,互聯(lián)網(wǎng)女皇為何看好麥克風(fēng)?》)

遙相呼應(yīng),最新一屆蘋果全球開發(fā)者大會(huì)WWDC上,庫克也放言將逐步向第三方開發(fā)者開放siri,如果這一切不是“講故事”的話,不出意料我們將看到iphone上出現(xiàn)更多的聲控APP,庫布斯是要玩一個(gè)“聲音版的生態(tài)化反”嗎?與此同時(shí),谷歌公司也提出了雄心勃勃的Google Home計(jì)劃,利用語音和自然語言查詢技術(shù)的結(jié)合侵入用戶的客廳。那么問題又來了,對(duì)于中國市場(chǎng)而言,聲音會(huì)是新的機(jī)會(huì)嗎,聲控交互會(huì)成為VR到來前大熱的交互模式嗎?中國的訊飛和喜馬拉雅們會(huì)一路插上翅膀開始騰飛嗎?

在此,菜狗必須首先潑一潑冷水,我最痛恨的莫過于照搬西方、哄抬賽道的路數(shù)打法,就像過去在文章中寫過的那樣,中國版的instagram、中國版的snapchat、中國版的……這些故事后來呢?所以如果今天是在這里放言要有一個(gè)中國版的Echo,那就是我自抽耳光、忽悠大家。但是,盡管我們不能照搬照抄西方流行的產(chǎn)品模式,卻完全可以分析他背后的東西——需求、心理和社會(huì)趨勢(shì):snapchat的崛起印證了im的高頻(臉書你反應(yīng)慢了給了機(jī)會(huì),但騰訊不會(huì))、社交壓力帶來的發(fā)布反悔(騰訊有微信消息可撤回)、年輕人尋求沒有父母的個(gè)性空間(騰訊有QQ空間)。所以,不論有沒有人會(huì)去copy to china,這背后有一個(gè)話題非常值得探討:

聲控交互的商業(yè)價(jià)值有多大?以語音信息和交互為主打的平臺(tái),將有怎樣的市場(chǎng)潛力?

一、當(dāng)下的聲音行業(yè)怎么了?

有人要說,這回你外行了,聲音的故事早就被我們玩爛了,結(jié)果也就那樣。確實(shí),印象中從許朝軍做啪啪的那一天開始,移動(dòng)互聯(lián)網(wǎng)似乎就已經(jīng)進(jìn)入了“聲音時(shí)代”,然并卵。

1、工具領(lǐng)域

科大訊飛強(qiáng)大的語音喚醒、識(shí)別、輸入和交互技術(shù)從實(shí)驗(yàn)室走上前臺(tái),領(lǐng)先是領(lǐng)先,但似乎并沒有得到太多的應(yīng)用,讓人印象最深刻的恐怕就是訊飛輸入法和最近非常文藝好用的語記平臺(tái),問題不在于訊飛有沒有成為中國的siri(漢語領(lǐng)域肯定強(qiáng)于siri),問題在于即便siri也遠(yuǎn)遠(yuǎn)沒有達(dá)到預(yù)期的效果、成為人們主流的交互方式,只是一個(gè)可有可無的玩具。

2、社交領(lǐng)域

涌現(xiàn)出唱吧、啪啪、抬杠、陪我、比鄰、偶爾、派派等一批聲音社交平臺(tái),然而幾年下來誰也沒有真正達(dá)到“社交平臺(tái)”的標(biāo)準(zhǔn)和要求。啪啪們的圖片加語音成了一種錦上添花的存在,遠(yuǎn)遠(yuǎn)沒有達(dá)到高頻剛需的狀態(tài),更何況其閱讀成本奇高,遠(yuǎn)遠(yuǎn)不能和立刻一目了然的圖片視頻相比;更多的平臺(tái)成了當(dāng)年的168聲訊臺(tái)、色情熱線,或者當(dāng)年的碧海銀沙聊天室;即便在主流的微信平臺(tái)上,動(dòng)不動(dòng)發(fā)語音的人、一發(fā)發(fā)一串的人也常常變成不受人們待見歡迎的存在。唯一做得好的可能就是唱吧,因?yàn)槌狵這樣一種生活中常見的社交模式真的只能靠聲音。

3、內(nèi)容領(lǐng)域

這可能是目前唯一可圈可點(diǎn)的區(qū)域,喜馬拉雅、echo、聽書、得到們從不同的角度切入,通過基于聲音的媒體內(nèi)容吸引了一票擁孬:比如根據(jù)易觀智庫的《中國移動(dòng)電臺(tái)市場(chǎng)年度綜合報(bào)告2016》,作為行業(yè)領(lǐng)跑的喜馬拉雅,其日活用戶滲透率已經(jīng)高達(dá)74.3%,這么好的DAU數(shù)據(jù)即便放在整個(gè)移動(dòng)互聯(lián)網(wǎng)領(lǐng)域也是不多見的,而最近這家平臺(tái)剛剛通過售賣奇葩說老僵尸們的《好好說話》語音節(jié)目賺得盆缽滿溢。

那么這里就有一個(gè)問題,為什么唯一做起來的是聲音內(nèi)容呢?同時(shí),在內(nèi)容生態(tài)領(lǐng)域最強(qiáng)的莫過于“兩微一端”(微信、微博、新聞客戶端),主打聲音的內(nèi)容平臺(tái)能做成那樣的體量嗎,以后有一天人們會(huì)說“兩微一端一電臺(tái)”?

二、當(dāng)前聲音的癥結(jié)在哪里?

有人又要說,聲音的內(nèi)容是還不錯(cuò)啊,但遠(yuǎn)遠(yuǎn)沒有到離不開的地步吧?而且,聲音這東西啊,太麻煩!是的,就是這個(gè)太麻煩!嚴(yán)重制約了聲音的發(fā)展。

1、語音識(shí)別交互領(lǐng)域,聲音一直沒有多少存在感

(1)、相關(guān)的技術(shù)要求太高

中國人說話遠(yuǎn)不像老外那樣一個(gè)單詞一個(gè)意思,而且各地的口音又完全不同,所以語音的識(shí)別、喚醒、輸入、交互都是問題,當(dāng)然強(qiáng)如科大訊飛已經(jīng)可以破譯粵語、上海話、四川話了,但是還會(huì)有后面的問題。

(2)、使用場(chǎng)景有限

視覺和觸覺的交互隨時(shí)隨地都可進(jìn)行,只要你低頭悄悄打開手機(jī)就行了,但是聲音呢,嘈雜的地方不行,人多的地方也不行,甚至晚上一個(gè)人了、對(duì)著冷冰冰的機(jī)器說話,也會(huì)有太裝太怪的感覺。

(3)、交互模式不自然

不論是siri的長按喚醒,還是傻乎乎地“嘿Siri”,感覺都比較違和,當(dāng)你看著屏幕上siri正處于“傾聽錄音”狀態(tài),心一下子就緊繃了,生怕說錯(cuò)或者說得不及時(shí),說完以后機(jī)器開始識(shí)別了,你看著進(jìn)度條又莫名其妙地焦慮不安起來、它能不能聽懂呢,會(huì)不會(huì)聽錯(cuò)呢?結(jié)果識(shí)別出來,果然是錯(cuò)的,日了狗了……

(4)、應(yīng)用生態(tài)遠(yuǎn)未形成

盡管訊飛們已經(jīng)開始開放語音功能和接口,但市面上并沒有出現(xiàn)很多的聲控交互應(yīng)用,特別是——沒有出現(xiàn)有影響力的第三方應(yīng)用。

2、語音終端遠(yuǎn)未成型

能夠大規(guī)模商用的中國版Echo還沒有出現(xiàn),即便非常厲害的可能也市場(chǎng)影響有限,養(yǎng)在深閨人不識(shí)吧。

3、語音內(nèi)容成本過高。

(1)、信息獲取成本過高

看文字可以一目十行,看圖片可以盡收眼底,看視頻基本3秒內(nèi)就可以判斷值不值得看下去。但是語音完全不是這樣,你聽一段語音(如果不是歌聲),往往得聽三分之一以上才能判斷是否值得聽,而這個(gè)過程是漫長的、聽的時(shí)候還動(dòng)不動(dòng)走神、左耳朵進(jìn)右耳朵出,如果再加上漫長的前奏簡直令人抓狂。這還只是一段語音,如果我又在很多語音中來回播放暫停選擇想聽的內(nèi)容呢?這個(gè)過程簡直繁瑣得崩潰了!

(2)、使用場(chǎng)景有限

一樣的道理,文字圖片可以在任何地方看吧,但是語音呢?

(3)、差異化價(jià)值“貌似”不高

既然都能看文字解決,為何要用語音呢,難道就是為了主播磁性的嗓音?如果是為了這些感性的體驗(yàn),視頻是不是更好一些呢?

這樣看起來,好像聲音一無是處,可真的是這樣嗎?解決幾個(gè)癥結(jié)就好了。

三、聲音的核心價(jià)值和競(jìng)爭力

回到開頭,我們來看Echo這個(gè)產(chǎn)品。它和siri最大的不同在于:這是一個(gè)純粹通過聲音、完全不需要屏幕的產(chǎn)品,看起來就像一臺(tái)音響,用起來就像和人對(duì)話一樣。進(jìn)一步說,它解放了人們的眼睛和雙手,你可以一邊做別的事情,一邊用聲音和它交互。

這樣一說就清楚了,歸根結(jié)底siri和訊飛們并不是純粹的聲控交互產(chǎn)品,他們頂多只能算半聲控交互產(chǎn)品,因?yàn)閺膯拘阉麄兊脚袛嗾Z音輸入準(zhǔn)確與否到最終的結(jié)果顯現(xiàn),你幾乎都要用到眼睛和手,聲控交互的核心價(jià)值“解放眼和手、不再低頭族”完全得不到顯現(xiàn)。換句話說,他們都是視觸覺交互的補(bǔ)充而已,所以本身就錦上添花、可有可無。

你用siri打開微信,比自己親手打開能方便多少呢?你用語音輸入法輸入一段話,錯(cuò)了還得回刪,這真的比打字輸入更方便嗎?

但是Echo展現(xiàn)出的是純粹聲控交互完全不同的價(jià)值,并且這幾乎是一個(gè)“高頻剛需”。

1、抓住了不適宜使用手和眼睛的人群

比如中老年人、殘疾人、不擅長打字輸入的人群,除非有一天人類技術(shù)發(fā)達(dá)到腦波交互,否則聲音都是最適合他們的交互模式。

2、抓住了不方便使用手和眼睛的場(chǎng)景

這就是我們常說的“低頭族場(chǎng)景”,走在路上、正在開車、晚上睡前、保護(hù)視力。由于以往的聲控交互產(chǎn)品做得太差,中國人以強(qiáng)大的適應(yīng)能力,練就了在這些場(chǎng)景“眼疾手快、目不離機(jī)”的超能力,哪怕視力下降、頭昏眼花、低頭撞人也在所不惜。但是試想一下,如果聲控交互真的做上去了,聲音真的成了喬布斯口中的“自然延伸”,他們還會(huì)這樣嗎?

3、創(chuàng)造了全新的伴隨式場(chǎng)景

小的時(shí)候,我們?yōu)楹卧缟掀饋頃?huì)聽收音機(jī),因?yàn)榭梢赃吢犨呑銎渌虑?,一心兩用。?duì),就是這個(gè)一心兩用!今天我們?yōu)楹螘?huì)一邊跑步一邊開車一邊聽喜馬拉雅——像筆者年初一邊在虹橋火車站辦手續(xù)一邊在喜馬拉雅聽羅胖的跨年演說、一邊熱淚盈眶……這都是一心兩用呀!簡言之,聲控交互解放了人的手和眼,不僅在不適宜使用眼手的“低頭族場(chǎng)景”,更在其他豐富的時(shí)刻。通過聲控交互,你可以邊聽邊說,一邊干其他事情,這種一心多用的方便效率是不可抵御的。本來這些事,你要不停切換APP來完成,或者放下手機(jī)、把視線移到別的地方,但是現(xiàn)在完全可以并行不悖、同步推進(jìn)了。

4、聲音有其獨(dú)有的魅力

Echo首先是音響,可以播放音樂。而在人與人的溝通中,影響最大的是身體語言帶來的氣場(chǎng)(可惜隔了手機(jī)屏幕就完全體現(xiàn)不出來了),其次就是聲音(音調(diào)音色節(jié)奏),最后才是內(nèi)容。從這個(gè)角度說,聲音的成本確實(shí)比文字高,卻遠(yuǎn)比文字“有溫度”,黃執(zhí)中的辯詞如果打成文字你未必讀得下去,但只要他魔鬼般的嗓音響起,你立刻覺得他什么都是對(duì)的了;聲音確實(shí)沒有視頻一目了然,但成本卻遠(yuǎn)比視頻要低,你不需要打瘦臉針玻尿酸弄出一張網(wǎng)紅臉,因?yàn)楫?dāng)你的聲音響起,沒有人在意發(fā)聲的人有沒有羅胖帥。這也是為什么最近大火的分答會(huì)用語音,一來“盜版”成本高一點(diǎn),二來聽到名人真實(shí)的聲音、這滿足感是不同的。

四、全新的機(jī)會(huì),聲控領(lǐng)域的BAT

BAT?有人要說了,你這不是在拉大旗做虎皮嗎,說到底還是忽悠我們開發(fā)中國版的Echo呀。

恰恰相反,我并不認(rèn)為Echo是創(chuàng)業(yè)者們最好的選擇,但是“基于純聲控交互”的APP卻可以成為一個(gè)機(jī)會(huì),關(guān)鍵在于訊飛和喜馬拉雅們能不能迅速“醒轉(zhuǎn)”,構(gòu)建出一個(gè)對(duì)第三方更加友好的生態(tài)。

什么是基于“純聲控交互”的APP,說白了就是整個(gè)APP的使用過程都完全不需要通過屏幕觸摸、不需要?jiǎng)佑醚劬碗p手,最好連喚醒他們都可以用聲音。這樣的APP一旦出現(xiàn),我們就根本不需要購買Echo,因?yàn)槭謾C(jī)就是個(gè)簡易版的Echo了,我把手機(jī)放在一邊,一邊做別的事情,一邊就可以使用聲控交互了。如果你使用與聲控系統(tǒng)匹配的專用耳麥,如果這個(gè)耳麥可以隨時(shí)響應(yīng)、識(shí)別你微小的聲音(在人群中大聲很傻比),那么耳麥就是Echo,就是手機(jī)之后真正的可穿戴智能硬件,比手表之類強(qiáng)多了。

基于目前已經(jīng)研發(fā)出的漢語語音識(shí)別喚醒技術(shù),訊飛完全具備這樣的能力,但是成果多半在實(shí)驗(yàn)室里睡大覺。如果能早一步開放出來,如果能搞好與蘋果安卓廠商們的合作不被“雪藏”,那么接下來的勢(shì)能是非??膳碌摹T诠P者看來,一旦聲控交互成熟了,接下來在這五個(gè)區(qū)域有明顯的機(jī)會(huì)。

1、新一代的語音助理,各個(gè)聲控應(yīng)用的統(tǒng)一調(diào)用入口

這是訊飛和siri們的機(jī)會(huì),喜馬拉雅這樣的高活躍產(chǎn)品也可以向此進(jìn)擊。簡言之就是聲控版的appstore、應(yīng)用寶。只要這個(gè)入口處于開啟狀態(tài),就可以隨時(shí)通過語音對(duì)話的方式調(diào)用各個(gè)聲控應(yīng)用,而不需要打開屏幕用眼睛找到那個(gè)應(yīng)用再點(diǎn)開——這就是軟件版的Echo。他的喚起和使用都應(yīng)該是毫不費(fèi)力、自然而然的,不要像siri那樣喊起來用力、用起來發(fā)急。可以想象,這個(gè)平臺(tái)會(huì)是未來聲控交互的入口,是整個(gè)聲控應(yīng)用生態(tài)的命脈。

2、聲控類的工具

在子不語的《下一代交互革命是語音:Voice In Voice Out》一文中,描述了這樣的場(chǎng)景:你可以和她交談,她可以幫你控制關(guān)于房子的一切,燈光、溫度、微波爐、冰箱……Echo 已經(jīng)能做到什么了呢?播放音樂、創(chuàng)建提醒、播報(bào)新聞自然不在話下,Echo還能根據(jù)你在亞馬遜上的購物記錄,智能地幫你下單。甚至,借助于前面提到的 Skills,已經(jīng)有人用 Echo 控制了家中的幾乎所有電器:燈光、溫控、電視機(jī)、AppleTV、安保監(jiān)控、熱水壺、車庫……當(dāng)然,這里就涉及到智能家居組網(wǎng)、車聯(lián)網(wǎng)等問題,后面會(huì)提到。

3、聲控類的社交

a、熟人通訊方面

我們應(yīng)該都見過這樣的場(chǎng)景,出租車上司機(jī)們通過對(duì)講平臺(tái)互相勾兌、插科打諢。路上匆忙的低頭族,很多都在回微信,而如果通過聲控交互構(gòu)建一個(gè)對(duì)講平臺(tái),這個(gè)體驗(yàn)就完全不一樣了,你不需要用眼和手也可以隨時(shí)給某某捎去一段話,別人給你發(fā)來語音、聲控交互會(huì)提示你是否接聽,而如果這個(gè)交互可以通過耳麥自動(dòng)識(shí)別微小的語音(并根據(jù)接聽者情況適度放大),那么以后走在路上就可以輕松而不違和地與人通話了,這個(gè)事情的意義在于將從另一個(gè)角度接管用戶的關(guān)系鏈,形成大網(wǎng)優(yōu)勢(shì)。

b、陌生人社交方面

當(dāng)下社交產(chǎn)品最大的痛點(diǎn)就是社交質(zhì)量差、低效社交多、效率遠(yuǎn)遠(yuǎn)趕不上用戶預(yù)期,一個(gè)突出表現(xiàn)就是搭訕無人理睬、理睬也在若干小時(shí)之后(所以人們?yōu)楹蜗矚g直播,因?yàn)槊琅鞑ブ辽贂?huì)說謝謝反饋下),但是語音溝通是一個(gè)更加強(qiáng)調(diào)即時(shí)性和真實(shí)性的場(chǎng)景,又不像視頻那么需要“化妝和端著”,所以反而可能成為新的突破口。至于當(dāng)下的語音社交平臺(tái)為何多數(shù)做的不好,因?yàn)樘裆槁曈嵟_(tái)了!到底應(yīng)該怎么做,筆者后頭的產(chǎn)品會(huì)做出回答。

4、聲音類的內(nèi)容

前面已經(jīng)說過,聲音內(nèi)容是目前做的最好的區(qū)塊,那么接下來的重點(diǎn)是:

a、改善交互

現(xiàn)在的模式是打開列表、看標(biāo)題內(nèi)容簡介、點(diǎn)播放鍵、再點(diǎn)暫停鍵、再看列表,這個(gè)過程太累了。但是試想一下,為什么我們小時(shí)候調(diào)收音機(jī)換臺(tái)不會(huì)這么累呢?為什么我們走在人群中偷聽不同人的對(duì)話不會(huì)這么累呢?因?yàn)檫@都是步驟更少、更加自然而然地交互,實(shí)際上美國已經(jīng)有一款非常厲害的可視化聲音應(yīng)用解決了交互成本問題,是什么先不表。

b、興趣推薦

如果選擇值得一聽的聲音節(jié)目成本如此之高,那么一個(gè)比較好的辦法就是基于興趣的推薦來降低選擇難度。比如喜馬拉雅已經(jīng)推出了“猜你喜歡”系統(tǒng),可以通過深度學(xué)習(xí)、進(jìn)行類似今日頭條那樣的個(gè)性化推薦。那么再進(jìn)一步,如果以后這個(gè)推薦可以不需要通過眼睛完成呢,直接傳來一個(gè)聲音:“小喜根據(jù)你的愛好搜到了幾個(gè)節(jié)目,下面念下標(biāo)題,你感興趣就喊要這個(gè)……”

c、時(shí)空觸發(fā)

這個(gè)意思是,應(yīng)該給更多的信息賦予時(shí)空屬性,比如在某一時(shí)刻放出,或者在某一位置放出。舉一個(gè)例子,你今天剛到一家商場(chǎng),連上wifi,耳麥里立刻提醒你有最新的優(yōu)惠活動(dòng)信息、要不要聽。你像即刻那樣設(shè)置一些關(guān)注節(jié)點(diǎn),比如某股又跌了,當(dāng)這個(gè)消息到來,耳麥里立刻提醒你要不要聽。你到達(dá)某個(gè)景點(diǎn),耳邊響起景點(diǎn)的典故。你晚上睡不著了,耳邊響起周圍人的聲音,像不像《her》?

d、做強(qiáng)參與

同為視頻,直播爆火的勁頭遠(yuǎn)遠(yuǎn)強(qiáng)于當(dāng)年的視頻平臺(tái)和短視頻,這也釋放了一個(gè)信號(hào),用戶并不滿足于成為單向的內(nèi)容接受者,他們也希望成為內(nèi)容的參與者甚至再創(chuàng)作者,他們也希望得到更多的互動(dòng)和回饋,來滿足參與感、存在感和歸屬感,所以類似電臺(tái)的互動(dòng)直播很重要。

e、聲紅生態(tài)

如何俘獲聲音領(lǐng)域的“網(wǎng)紅”們,通過更豐富的辦法幫助他們獲取規(guī)模精準(zhǔn)流量、降低內(nèi)容生產(chǎn)門檻、維護(hù)粉絲社群、持續(xù)多樣化盈利。比如喜馬拉雅的PUGC生態(tài)戰(zhàn)略,已經(jīng)擁有400萬主播、8萬認(rèn)證主播,這個(gè)供給端的大棋該怎么下下去?

f、制作成本

事實(shí)上制作成本的問題完全可以解決,一個(gè)是更加靈活強(qiáng)大的聲音編輯工具,另一個(gè)其實(shí)是文字到聲音的轉(zhuǎn)化工具——你聲音不好?你不會(huì)抑揚(yáng)頓挫?那么訊飛正在嘗試在語記一類的平臺(tái)推出文字轉(zhuǎn)化成聲音的功能,不是冰冷死板的普通話,而是可以轉(zhuǎn)成蘿莉的聲音、方言的聲音、林志玲的聲音、單田芳的聲音……

5、聲控類的終端

盡管菜狗對(duì)硬件終端充滿了“恐懼心理”,但是說到底,如果這個(gè)聲控交互能強(qiáng)大到占領(lǐng)你的客廳,占領(lǐng)你的臥室,占領(lǐng)你的駕駛室,甚至更強(qiáng)大一些,可以無處不在,像《her》中那樣在云端接受和處理不同人的信息,你可以在任意的咖啡館、寫字樓、商店、公交上喚起他……那么毫無疑問,這一切都需要終端領(lǐng)域的進(jìn)擊。如果這個(gè)事情有人能做起來,那就是真正的“生態(tài)化反”了。

五、聲控交互還有多遠(yuǎn)?

聲控交互不是簡單的YY,事實(shí)上未來已經(jīng)到來。

以智能終端為例,科大訊飛已經(jīng)推出了一款名為叮咚的智能wifi音箱,也許用不了多久這種漢語聲控的設(shè)備就會(huì)出現(xiàn)在你的身邊。同時(shí)進(jìn)軍音箱領(lǐng)域的喜馬拉雅FM一方面將內(nèi)容植入Sonos、哈曼、漫步者、Misfit等智能產(chǎn)品中,另一方面通過收購國內(nèi)頂尖音箱廠商海趣科技,自主研發(fā)了3D降噪耳機(jī)等產(chǎn)品。

在應(yīng)用場(chǎng)景方面,兩家聲音領(lǐng)域的巨頭聯(lián)合推出了語音開放平臺(tái),喜馬拉雅FM的“喜馬拉雅inside”開放平臺(tái)直接對(duì)接各類下游硬件研發(fā)和生產(chǎn)企業(yè),打造應(yīng)用生態(tài)、拓寬應(yīng)用場(chǎng)景的野心一目了然。喜馬拉雅FM的海量音頻內(nèi)容已經(jīng)植入智能家居、汽車、音箱等超過300家品牌,包括寶馬、福特 、比亞迪 、百度Carlife在在內(nèi)的幾乎所有主流車廠(車載系統(tǒng))已全線接入喜馬拉雅FM;車生活系列的隨車聽正在侵入用戶的駕駛室,家聲活系列的故事機(jī)、聽書寶、接入喜馬拉雅的智能冰箱已經(jīng)開始覬覦用戶的家居生活。與此同時(shí)蜻蜓FM和考拉FM的車聯(lián)網(wǎng)、智能家居戰(zhàn)略已經(jīng)磨刀霍霍。

這就是不久的將來,聲音將像水和電一樣,隨取隨用,自由流動(dòng)在每一個(gè)人的耳朵和心里。明確的人群和場(chǎng)景、高頻應(yīng)用的可能、進(jìn)一步侵入住家私車進(jìn)而無處不在的潛力、明確的技術(shù)和標(biāo)準(zhǔn)門檻,這個(gè)故事看來很美好。但是最后菜狗還是必須提醒大家,這一切的前提是:技術(shù)足夠強(qiáng)大并且向第三方開放、聲控交互的全面優(yōu)化和規(guī)范形成、蘋果安卓們?cè)敢庾尦鲞@塊肥肉、有影響力的聲控應(yīng)用的出現(xiàn)。這里面每一步的實(shí)現(xiàn)都不是輕而易舉的,但正如互聯(lián)網(wǎng)女皇說的那樣,聲音正在成熟,目前是最接近這個(gè)機(jī)會(huì)的節(jié)點(diǎn)。

#專欄作家#

張俊,上海帥醒科技創(chuàng)始人兼CEO,人人都是產(chǎn)品經(jīng)理專欄作家,斯恩斯研究院創(chuàng)始人。微信號(hào):biohazard2015。野路子產(chǎn)品菜狗一枚、創(chuàng)業(yè)在上海,測(cè)試新一代興趣APP中,歡迎勾兌,吵架不回。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,不得轉(zhuǎn)載。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 最近也在做語音方面的思考,越思考越覺得很多事很有趣,希望有時(shí)間可以交流一下

    來自四川 回復(fù)