“閑聊”的當(dāng)前現(xiàn)狀及未來(lái)展望
“閑聊”短時(shí)間內(nèi)還是需要產(chǎn)品驅(qū)動(dòng),而長(zhǎng)時(shí)間則可能是依賴(lài)技術(shù)驅(qū)動(dòng)。
現(xiàn)狀梳理
人機(jī)對(duì)話(huà)的發(fā)展還處在起步階段,音箱之間的大戰(zhàn)就是一個(gè)很好的開(kāi)始,未來(lái)會(huì)有更多的設(shè)備被賦予對(duì)話(huà)的能力。
目前整個(gè)過(guò)程最大的問(wèn)題在于自然語(yǔ)言處理(即NLP),在這個(gè)NLP中最不好處理的就是開(kāi)放域的閑聊了,這也是無(wú)論那個(gè)公司的”對(duì)話(huà)系統(tǒng)(廣義上的語(yǔ)音交互設(shè)備所搭載的系統(tǒng))“,都會(huì)出現(xiàn)答非所問(wèn)的情況。
用戶(hù)體驗(yàn)角度
1. 了解競(jìng)品(這里指狹義上的競(jìng)品)
目前知名度最高的閑聊機(jī)器人就是小冰,小冰也是業(yè)內(nèi)首個(gè)提出用“交互次數(shù)(即CPS)”來(lái)作為衡量閑聊質(zhì)量的方式,而其他公司大多都還在用“單輪準(zhǔn)確率”來(lái)衡量聊天的好壞,這里最大的問(wèn)題是評(píng)判標(biāo)準(zhǔn)過(guò)于主觀。當(dāng)然也有公司以其他相關(guān)轉(zhuǎn)化率為目標(biāo),不在分析范圍內(nèi)。
所以這里主要分為:以提升CPS為目標(biāo)的小冰和以提升單輪準(zhǔn)確率為目標(biāo)的其他公司。
2. 競(jìng)品優(yōu)劣
前面已經(jīng)分析過(guò)了,各個(gè)公司的優(yōu)化目標(biāo)不同,所以他們出現(xiàn)的問(wèn)題也會(huì)有所差異。
小冰:由于小冰以CPS為目標(biāo),所以導(dǎo)致小冰非常善于引導(dǎo)對(duì)話(huà),也就是說(shuō)小冰的主動(dòng)性太強(qiáng)了,就像你有一個(gè)非常愛(ài)嘮嗑的朋友,時(shí)不時(shí)還帶著你一起跑題。帶來(lái)的問(wèn)題就是小冰常常會(huì)回復(fù)的答非所問(wèn),讓人感覺(jué)不知所云。
還有小冰為了實(shí)現(xiàn)上下文的關(guān)聯(lián)性,他們聊天庫(kù)的語(yǔ)料是進(jìn)行分類(lèi)的,也就是當(dāng)你談到某個(gè)話(huà)題時(shí),他會(huì)在當(dāng)前的聊天中,固定出現(xiàn)該話(huà)題的語(yǔ)料,使用戶(hù)感覺(jué)到一直再聊一個(gè)事情。帶來(lái)的問(wèn)題就是和小冰閑聊很難跳出該話(huà)題,不能夠更靈活的應(yīng)對(duì)用戶(hù)的反饋。
其他公司:那些重視單輪準(zhǔn)確率的閑聊,單獨(dú)拿出來(lái)每句話(huà)看,給人的感覺(jué)是很難區(qū)分這是人還是機(jī)器人。但是整體一起看,很容易就能看出來(lái),其中前后矛盾,指代不明的現(xiàn)象頻繁出現(xiàn),很難堅(jiān)持聊下去。
由于為了提高單輪準(zhǔn)確率,最簡(jiǎn)單的方式補(bǔ)充聊天庫(kù),即Q-A語(yǔ)料。這時(shí)候的閑聊機(jī)器人是被動(dòng)的,也就是你問(wèn)他,他才會(huì)回復(fù),當(dāng)你不知道該說(shuō)什么的時(shí)候,對(duì)話(huà)就結(jié)束了。
綜合考慮,就用戶(hù)體驗(yàn)的角度來(lái)講,CPS為目標(biāo)更加客觀,更能滿(mǎn)足用戶(hù)的需求。
3. 潛在價(jià)值
閑聊無(wú)用論現(xiàn)在是大家的共識(shí),這也是除小冰外,很少見(jiàn)大公司把這個(gè)當(dāng)作核心來(lái)做。其實(shí)這主要因?yàn)闆](méi)有明確的商業(yè)模式,而且技術(shù)瓶頸明顯,但是市場(chǎng)規(guī)模還是很大的。因?yàn)榱奶鞂?duì)話(huà)是人類(lèi)的天性,每個(gè)人都需要一個(gè)可以說(shuō)心里話(huà)的人,目前技術(shù)是主要瓶頸,無(wú)法支撐開(kāi)放域的自由對(duì)話(huà),讓人感覺(jué)沒(méi)有人會(huì)和機(jī)器人聊天。
想要從閑聊的角度抓住用戶(hù),那一定是要滿(mǎn)足情感的需求。
技術(shù)解決角度
面對(duì)開(kāi)放域閑聊各種各樣的問(wèn)題,也有各種各樣的解決方法,我按照自己的理解,大致分為三種方式算法、正則、兜底。
1. 算法
隨著深度學(xué)習(xí)的發(fā)展,算法這個(gè)詞逐漸進(jìn)入人們眼中,給人一種高深莫測(cè)的感覺(jué),但是在自然語(yǔ)言處理中,所能起到的作用還是很有限的。按照回復(fù)方式,現(xiàn)在算法主要分為:匹配算法(計(jì)算兩個(gè)句子的是否匹配)、解析算法(先給輸入進(jìn)行分類(lèi),再按照預(yù)設(shè)類(lèi)別回復(fù))和生成算法(直接生成回復(fù))
匹配算法:這應(yīng)該是閑聊最重要的算法了,主要是從海量聊天庫(kù)中找到相似的句子,和搜索用到的算法較一致。
解析算法:目前很多公司都用到了,主要就是通過(guò)模型對(duì)輸入進(jìn)行分類(lèi),也是目前算法的主流用法。
生成算法:很少有公司用這類(lèi)算法,主要還是回復(fù)結(jié)果并不可控,據(jù)說(shuō)中文版的小冰有10%的回復(fù)使用該算法。
2. 正則
正則指得就是正則表達(dá)式,這是比較傳統(tǒng)的方式,雖然簡(jiǎn)單,但是效果立竿見(jiàn)影。這種方式在技能上比較常見(jiàn),我覺(jué)得正則即可以準(zhǔn)確到完全匹配,也可以泛化到關(guān)鍵詞回復(fù)。
3. 隨機(jī)
所謂隨機(jī)就是不做任何解析,隨機(jī)回復(fù)我們預(yù)設(shè)好的回復(fù)。這往往用來(lái)解決超過(guò)機(jī)器人能力范圍時(shí),給用戶(hù)的一個(gè)反饋。在明知無(wú)法滿(mǎn)足用戶(hù)需求的情況下,回復(fù)的話(huà)術(shù)就會(huì)很重要,不同產(chǎn)品需要不同的設(shè)計(jì)思路。
語(yǔ)言的本質(zhì)
之前在一篇文章當(dāng)中看到一個(gè)對(duì)語(yǔ)言本質(zhì)的理解,說(shuō)“語(yǔ)言時(shí)思維的映射”。也就是說(shuō)如果你不會(huì)思考,那么你的語(yǔ)言終究是假的,是存在于表面的。而現(xiàn)在的深度學(xué)習(xí),也只是在利用大量的數(shù)據(jù)進(jìn)行特征提取,并沒(méi)有因果關(guān)系的推理,所以當(dāng)前的深度學(xué)習(xí)在NLP領(lǐng)域,能力有限。而想要實(shí)現(xiàn)真正像人一樣的閑聊,還是需要一定的時(shí)間,短時(shí)間內(nèi)無(wú)法速成。
未來(lái)展望
理解了閑聊的現(xiàn)狀,想象一下閑聊的未來(lái),目前閑聊在對(duì)話(huà)系統(tǒng)中的位置可能如下:
1. 隨著人機(jī)對(duì)話(huà)的普及,會(huì)有越來(lái)越多的產(chǎn)品搭載對(duì)話(huà)系統(tǒng),閑聊將長(zhǎng)時(shí)間會(huì)作為一個(gè)”兜底“的存在,用來(lái)解決技能以外的輸入。當(dāng)技能識(shí)別率和技能資源趨于一致的情況下,對(duì)話(huà)系統(tǒng)中的閑聊將會(huì)成為一個(gè)加分項(xiàng)的。
2. 閑聊如果可以收集到用戶(hù)畫(huà)像,那么基于閑聊的推薦系統(tǒng)將會(huì)發(fā)揮很大的作用,這個(gè)需要根據(jù)不同的產(chǎn)品進(jìn)行設(shè)計(jì)。如果做推薦,想到最好的入手點(diǎn)還是前面說(shuō)到的情感,情感一方面可以造成用戶(hù)粘性,另一方面可以獲得用戶(hù)的信任。
我按照對(duì)語(yǔ)言本質(zhì)的猜測(cè),將閑聊未來(lái)的發(fā)展分成兩部分,分割線(xiàn)就是技術(shù)是否可以讓技術(shù)實(shí)現(xiàn)思考:
1. 閑聊短時(shí)間內(nèi)還是需要產(chǎn)品驅(qū)動(dòng),而產(chǎn)品即需要了解當(dāng)前技術(shù)瓶頸,也需要了解用戶(hù)需求,甚至需求背后的人性,還有閑聊在整個(gè)產(chǎn)品中的定位,才有機(jī)會(huì)提升閑聊的用戶(hù)體驗(yàn)。
2. 閑聊長(zhǎng)時(shí)間的未來(lái)可能是技術(shù)驅(qū)動(dòng),而產(chǎn)品只是一個(gè)輔助的角色。先進(jìn)的技術(shù)可以讓機(jī)器人思考,調(diào)整相關(guān)的參數(shù),就可以改變機(jī)器思考的方式,這個(gè)時(shí)候產(chǎn)品的作用就不再那么重要。
本文由 @我叫人人 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
不錯(cuò)