語(yǔ)音識(shí)別關(guān)鍵詞,如何獲取房產(chǎn)成交信息?
針對(duì)房產(chǎn)中介平臺(tái)無(wú)法及時(shí)獲取成交信息的現(xiàn)象,語(yǔ)音識(shí)別關(guān)鍵詞的應(yīng)用能夠有效解決這個(gè)問(wèn)題。不過(guò),你知道獲取關(guān)鍵詞后的篩選與識(shí)別是怎么做的嗎?正文將為你揭曉答案。
近年來(lái)隨著互聯(lián)網(wǎng)、GPU/CPU硬件的發(fā)展,語(yǔ)音識(shí)別的準(zhǔn)確率有了很高的提升,并開始在商業(yè)上進(jìn)行應(yīng)用。不管是國(guó)內(nèi)百度的小度助手,還是Google Assistant、亞馬遜Alexa,早已不再滿足于“語(yǔ)音助手”的身份,在功能上開始向語(yǔ)音對(duì)話、內(nèi)容服務(wù)、IoT設(shè)備管理等方向演進(jìn),幾乎所有的互聯(lián)網(wǎng)巨頭都對(duì)語(yǔ)音勢(shì)在必得。
人工智能慢慢步入了我們的生活,為我們帶來(lái)便利的工具值得去挖掘。語(yǔ)音識(shí)別技術(shù)在房產(chǎn)市場(chǎng)是如何應(yīng)用的呢?除了語(yǔ)音助手外,期望能通過(guò)語(yǔ)音識(shí)別功能幫助業(yè)務(wù)提升效率。本文復(fù)盤了語(yǔ)音識(shí)別關(guān)鍵詞在房產(chǎn)中的應(yīng)用,以此總結(jié)項(xiàng)目中的收獲和不足,也期待對(duì)您有所幫助。
平臺(tái)供給房源,但房源成交后,不能及時(shí)獲取成交信息。所以需要從房主、經(jīng)紀(jì)人、平臺(tái)三方去考慮如何獲取到成交信息:
- 從房主切入,可以在房主小程序/APP提供房主停售的入口,也可以通過(guò)短信或者模板消息觸達(dá)到房主,提醒房主若有成交,及時(shí)反饋給平臺(tái)。
- 從經(jīng)紀(jì)人切入,可以提供反饋機(jī)制,通過(guò)成功反饋贈(zèng)送積分的方式,激勵(lì)經(jīng)紀(jì)人主動(dòng)反饋。
- 從平臺(tái)切入,平臺(tái)已通過(guò)阿里的虛擬號(hào),獲得經(jīng)紀(jì)人和房主的通話錄音,可通過(guò)語(yǔ)音轉(zhuǎn)文字識(shí)別出疑似成交的房源。
語(yǔ)音轉(zhuǎn)文字
為保護(hù)房主隱私,平臺(tái)從阿里購(gòu)得AXB中間號(hào),阿里提供通話錄音及轉(zhuǎn)文字功能,識(shí)別的文字通過(guò)接口回調(diào)到平臺(tái),依賴于阿里轉(zhuǎn)文字效率,所以文字識(shí)別會(huì)有時(shí)間延遲,在識(shí)別策略中,會(huì)考慮時(shí)間的因素。有了文字后,下一步要提取關(guān)鍵詞,識(shí)別成交房源。
關(guān)鍵詞識(shí)別分析
1. 目標(biāo):通過(guò)錄音關(guān)鍵詞識(shí)別出成交的房源。
2. 指標(biāo):召回率和準(zhǔn)確率是對(duì)策略質(zhì)量評(píng)估的方法,可以通過(guò)召回率、準(zhǔn)確率、誤判率等檢驗(yàn)上線后的質(zhì)量評(píng)估。召回率代表策略對(duì)問(wèn)題的解決程度,而準(zhǔn)確率、誤判率代表策略有沒(méi)有帶來(lái)其他傷害。
3. 影響因素:
- ①錄音轉(zhuǎn)文字的準(zhǔn)確度
- ②關(guān)鍵詞的準(zhǔn)確度
- ③經(jīng)紀(jì)人撥打電話的頻次
①和③受外部因素制約,本次版本暫時(shí)不考慮,重心放至關(guān)鍵詞的準(zhǔn)確度上。
4. 需要人工干預(yù):由于以上三個(gè)制約因素,識(shí)別的結(jié)果不一定100%準(zhǔn)確,平臺(tái)需要安排專職人員對(duì)識(shí)別結(jié)果進(jìn)行人工判斷,防止誤判。
提取關(guān)鍵詞
拉取3000條錄音轉(zhuǎn)文字?jǐn)?shù)據(jù),用Excel初步分析,過(guò)濾不需要的重復(fù)詞,例如語(yǔ)音詞、象聲詞、問(wèn)候詞等,再用Wordart(https://wordart.com/)分析,找到關(guān)鍵詞。
1.0版本
1. 關(guān)鍵字提取時(shí)間:通話錄音轉(zhuǎn)換文字成功后,每30min對(duì)未處理的內(nèi)容識(shí)別一次。
2. 識(shí)別策略:若錄音內(nèi)容中,涉及如下關(guān)鍵字,則認(rèn)為該錄音命中“疑似成交”關(guān)鍵詞。
- ①賣完
- ②已經(jīng)賣了
- ③暫時(shí)不賣
- ④我不賣了
- ⑤賣了好久了
- ⑥早都賣了
3. 增加人為審核操作,并記錄處理人和處理時(shí)間
4. 識(shí)別結(jié)果中展示識(shí)別文本和錄音,可隨時(shí)校驗(yàn)結(jié)果
策略質(zhì)量評(píng)估
1. 召回率、準(zhǔn)確率和誤判率分析
對(duì)上線后一天的數(shù)據(jù)進(jìn)行了分析,召回了25條數(shù)據(jù),其中19條命中成交,6條誤判,還有7條數(shù)據(jù)沒(méi)有識(shí)別出。
對(duì)誤判數(shù)據(jù)進(jìn)行分析,“賣完”這個(gè)關(guān)鍵詞出現(xiàn)在誤判里的頻次很高,針對(duì)該關(guān)鍵詞,下一步需要優(yōu)化識(shí)別策略。
對(duì)未識(shí)別數(shù)據(jù)進(jìn)行分析,“賣了”這個(gè)關(guān)鍵詞出現(xiàn)的頻次很大,但這個(gè)關(guān)鍵詞爭(zhēng)議較大,會(huì)出現(xiàn)在經(jīng)紀(jì)人的問(wèn)話中,例如:“您賣了嗎?”如果用它識(shí)別,誤判率會(huì)很高。
2. 功能問(wèn)題
①同一房源存在多條錄音,每條錄音都要處理,較繁瑣。
②平臺(tái)上房源下架有統(tǒng)一接口,所以審核和下架是兩個(gè)分開的功能操作,審核房源后,遵循排序規(guī)則:待處理>已處理,數(shù)據(jù)自動(dòng)下沉,尋找當(dāng)前房源做下架處理較繁瑣。
③處理狀態(tài)沒(méi)有顯示在列表上,不能直觀看見處理結(jié)果。
1.1版本
1. 規(guī)則優(yōu)化
針對(duì)1.0上線,拉了1000條錄音進(jìn)行分析,發(fā)現(xiàn)顯性關(guān)鍵詞命中率很高,所以優(yōu)先判斷顯性關(guān)鍵詞,若無(wú)顯性關(guān)鍵詞,通過(guò)非顯性關(guān)鍵詞和時(shí)間維度去判斷,一般房子賣了,經(jīng)紀(jì)人的通話都會(huì)很短。
①判斷文字中是否有以下關(guān)鍵詞,若有,則認(rèn)為疑似成交:
已經(jīng)賣了、暫時(shí)不賣、我不賣了、賣了好久了、早都賣了、先不賣了、不想賣了
②若無(wú)上述關(guān)鍵詞,則判斷語(yǔ)音時(shí)長(zhǎng),若時(shí)長(zhǎng)<1min,且包含下列關(guān)鍵詞,則認(rèn)為疑似成交:
不賣了、賣了、賣完、沒(méi)有了、撤了、下架、取消
2. 功能優(yōu)化
(1)狀態(tài)優(yōu)化:列表顯示狀態(tài)“未處理、已成交、未成交”3種。
(2)若一個(gè)房源有多條未處理的數(shù)據(jù),處理最近時(shí)間的一條,該房源所有之前未處理的數(shù)據(jù)狀態(tài)變更為相應(yīng)的狀態(tài),處理時(shí)間&處理人同理。
(3)列表刷新邏輯優(yōu)化:完成“審核”后不刷新列表,僅變更狀態(tài)、處理人、處理時(shí)間等相關(guān)數(shù)據(jù)。再次進(jìn)入菜單,才刷新整個(gè)頁(yè)面。
策略質(zhì)量評(píng)估
召回率、準(zhǔn)確率和誤判率分析
對(duì)上線后一天的數(shù)據(jù)進(jìn)行了分析,召回了26條數(shù)據(jù),其中12條命中成交,14條誤判,還有1條數(shù)據(jù)沒(méi)有識(shí)別出。
通過(guò)上面的數(shù)據(jù)發(fā)現(xiàn):增加非顯性關(guān)鍵詞+時(shí)間的識(shí)別,準(zhǔn)確率增加,但是也召回了很多非成交數(shù)據(jù),所以誤判率也增高。雖然滿足寧可錯(cuò)殺一千,也不能漏一個(gè)的原則,但還會(huì)拉更多的數(shù)據(jù)進(jìn)行分析,優(yōu)化時(shí)間維度的策略。
上述案例中,通過(guò)優(yōu)化關(guān)鍵詞策略,提高召回率,運(yùn)用了策略質(zhì)量評(píng)估方法,判斷召回造成的影響,下一步要降低誤判率。
在實(shí)際操作中,錄音轉(zhuǎn)文字的準(zhǔn)確度影響也很大(見上圖),我們也做了相關(guān)的數(shù)據(jù)統(tǒng)計(jì),在未識(shí)別數(shù)據(jù)中,有30%的數(shù)據(jù)屬于文字準(zhǔn)確度不高導(dǎo)致的,這個(gè)無(wú)法避免,機(jī)器對(duì)噪音的抗噪性不夠強(qiáng),另外,語(yǔ)音識(shí)別并沒(méi)有理解語(yǔ)義,若雙方都用方言講話,識(shí)別的準(zhǔn)確率會(huì)更低。
語(yǔ)音識(shí)別,在這幾年有了極大的發(fā)展,從算法到模型都有了質(zhì)的變化,在加上語(yǔ)音領(lǐng)域(語(yǔ)音合成等)的其他研究,語(yǔ)音技術(shù)陸續(xù)進(jìn)入工業(yè)、家庭機(jī)器人、通信、車載導(dǎo)航等各個(gè)領(lǐng)域中。本項(xiàng)目借助語(yǔ)音識(shí)別技術(shù)轉(zhuǎn)文字,再通過(guò)文字關(guān)鍵詞識(shí)別出成交房源,讓語(yǔ)音識(shí)別在房產(chǎn)市場(chǎng)得到應(yīng)用。
專欄作家
余田,人人都是產(chǎn)品經(jīng)理專欄作家,數(shù)據(jù)產(chǎn)品經(jīng)理,《用戶至上-用戶研究方法與實(shí)踐》譯者。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

我是不會(huì)給你這個(gè)權(quán)限的
學(xué)習(xí)了~感覺(jué)還挺好玩
學(xué)習(xí)了
?? 共同進(jìn)步