語(yǔ)音識(shí)別關(guān)鍵詞,如何獲取房產(chǎn)成交信息?

余田
4 評(píng)論 4458 瀏覽 15 收藏 11 分鐘
🔗 产品经理在不同的职业阶段,需要侧重不同的方面,从基础技能、业务深度、专业领域到战略规划和管理能力。

針對(duì)房產(chǎn)中介平臺(tái)無(wú)法及時(shí)獲取成交信息的現(xiàn)象,語(yǔ)音識(shí)別關(guān)鍵詞的應(yīng)用能夠有效解決這個(gè)問(wèn)題。不過(guò),你知道獲取關(guān)鍵詞后的篩選與識(shí)別是怎么做的嗎?正文將為你揭曉答案。

近年來(lái)隨著互聯(lián)網(wǎng)、GPU/CPU硬件的發(fā)展,語(yǔ)音識(shí)別的準(zhǔn)確率有了很高的提升,并開始在商業(yè)上進(jìn)行應(yīng)用。不管是國(guó)內(nèi)百度的小度助手,還是Google Assistant、亞馬遜Alexa,早已不再滿足于“語(yǔ)音助手”的身份,在功能上開始向語(yǔ)音對(duì)話、內(nèi)容服務(wù)、IoT設(shè)備管理等方向演進(jìn),幾乎所有的互聯(lián)網(wǎng)巨頭都對(duì)語(yǔ)音勢(shì)在必得。

人工智能慢慢步入了我們的生活,為我們帶來(lái)便利的工具值得去挖掘。語(yǔ)音識(shí)別技術(shù)在房產(chǎn)市場(chǎng)是如何應(yīng)用的呢?除了語(yǔ)音助手外,期望能通過(guò)語(yǔ)音識(shí)別功能幫助業(yè)務(wù)提升效率。本文復(fù)盤了語(yǔ)音識(shí)別關(guān)鍵詞在房產(chǎn)中的應(yīng)用,以此總結(jié)項(xiàng)目中的收獲和不足,也期待對(duì)您有所幫助。

平臺(tái)供給房源,但房源成交后,不能及時(shí)獲取成交信息。所以需要從房主、經(jīng)紀(jì)人、平臺(tái)三方去考慮如何獲取到成交信息:

  • 從房主切入,可以在房主小程序/APP提供房主停售的入口,也可以通過(guò)短信或者模板消息觸達(dá)到房主,提醒房主若有成交,及時(shí)反饋給平臺(tái)。
  • 從經(jīng)紀(jì)人切入,可以提供反饋機(jī)制,通過(guò)成功反饋贈(zèng)送積分的方式,激勵(lì)經(jīng)紀(jì)人主動(dòng)反饋。
  • 從平臺(tái)切入,平臺(tái)已通過(guò)阿里的虛擬號(hào),獲得經(jīng)紀(jì)人和房主的通話錄音,可通過(guò)語(yǔ)音轉(zhuǎn)文字識(shí)別出疑似成交的房源。

語(yǔ)音轉(zhuǎn)文字

為保護(hù)房主隱私,平臺(tái)從阿里購(gòu)得AXB中間號(hào),阿里提供通話錄音及轉(zhuǎn)文字功能,識(shí)別的文字通過(guò)接口回調(diào)到平臺(tái),依賴于阿里轉(zhuǎn)文字效率,所以文字識(shí)別會(huì)有時(shí)間延遲,在識(shí)別策略中,會(huì)考慮時(shí)間的因素。有了文字后,下一步要提取關(guān)鍵詞,識(shí)別成交房源。

關(guān)鍵詞識(shí)別分析

1. 目標(biāo):通過(guò)錄音關(guān)鍵詞識(shí)別出成交的房源。

2. 指標(biāo):召回率和準(zhǔn)確率是對(duì)策略質(zhì)量評(píng)估的方法,可以通過(guò)召回率、準(zhǔn)確率、誤判率等檢驗(yàn)上線后的質(zhì)量評(píng)估。召回率代表策略對(duì)問(wèn)題的解決程度,而準(zhǔn)確率、誤判率代表策略有沒(méi)有帶來(lái)其他傷害。

?召回率=識(shí)別總數(shù)/理想成交數(shù) 準(zhǔn)確率=識(shí)別成交數(shù)/理想成交數(shù) 誤判率=誤判數(shù)/識(shí)別總數(shù)

3. 影響因素:

  • ①錄音轉(zhuǎn)文字的準(zhǔn)確度
  • ②關(guān)鍵詞的準(zhǔn)確度
  • ③經(jīng)紀(jì)人撥打電話的頻次

①和③受外部因素制約,本次版本暫時(shí)不考慮,重心放至關(guān)鍵詞的準(zhǔn)確度上。

4. 需要人工干預(yù):由于以上三個(gè)制約因素,識(shí)別的結(jié)果不一定100%準(zhǔn)確,平臺(tái)需要安排專職人員對(duì)識(shí)別結(jié)果進(jìn)行人工判斷,防止誤判。

提取關(guān)鍵詞

拉取3000條錄音轉(zhuǎn)文字?jǐn)?shù)據(jù),用Excel初步分析,過(guò)濾不需要的重復(fù)詞,例如語(yǔ)音詞、象聲詞、問(wèn)候詞等,再用Wordart(https://wordart.com/)分析,找到關(guān)鍵詞。

1.0版本

1. 關(guān)鍵字提取時(shí)間:通話錄音轉(zhuǎn)換文字成功后,每30min對(duì)未處理的內(nèi)容識(shí)別一次。

2. 識(shí)別策略:若錄音內(nèi)容中,涉及如下關(guān)鍵字,則認(rèn)為該錄音命中“疑似成交”關(guān)鍵詞。

  • ①賣完
  • ②已經(jīng)賣了
  • ③暫時(shí)不賣
  • ④我不賣了
  • ⑤賣了好久了
  • ⑥早都賣了

3. 增加人為審核操作,并記錄處理人和處理時(shí)間

4. 識(shí)別結(jié)果中展示識(shí)別文本和錄音,可隨時(shí)校驗(yàn)結(jié)果

策略質(zhì)量評(píng)估

1. 召回率、準(zhǔn)確率和誤判率分析

對(duì)上線后一天的數(shù)據(jù)進(jìn)行了分析,召回了25條數(shù)據(jù),其中19條命中成交,6條誤判,還有7條數(shù)據(jù)沒(méi)有識(shí)別出。

對(duì)誤判數(shù)據(jù)進(jìn)行分析,“賣完”這個(gè)關(guān)鍵詞出現(xiàn)在誤判里的頻次很高,針對(duì)該關(guān)鍵詞,下一步需要優(yōu)化識(shí)別策略。

對(duì)未識(shí)別數(shù)據(jù)進(jìn)行分析,“賣了”這個(gè)關(guān)鍵詞出現(xiàn)的頻次很大,但這個(gè)關(guān)鍵詞爭(zhēng)議較大,會(huì)出現(xiàn)在經(jīng)紀(jì)人的問(wèn)話中,例如:“您賣了嗎?”如果用它識(shí)別,誤判率會(huì)很高。

2. 功能問(wèn)題

①同一房源存在多條錄音,每條錄音都要處理,較繁瑣。

②平臺(tái)上房源下架有統(tǒng)一接口,所以審核和下架是兩個(gè)分開的功能操作,審核房源后,遵循排序規(guī)則:待處理>已處理,數(shù)據(jù)自動(dòng)下沉,尋找當(dāng)前房源做下架處理較繁瑣。

③處理狀態(tài)沒(méi)有顯示在列表上,不能直觀看見處理結(jié)果。

1.1版本

1. 規(guī)則優(yōu)化

針對(duì)1.0上線,拉了1000條錄音進(jìn)行分析,發(fā)現(xiàn)顯性關(guān)鍵詞命中率很高,所以優(yōu)先判斷顯性關(guān)鍵詞,若無(wú)顯性關(guān)鍵詞,通過(guò)非顯性關(guān)鍵詞和時(shí)間維度去判斷,一般房子賣了,經(jīng)紀(jì)人的通話都會(huì)很短。

①判斷文字中是否有以下關(guān)鍵詞,若有,則認(rèn)為疑似成交:

已經(jīng)賣了、暫時(shí)不賣、我不賣了、賣了好久了、早都賣了、先不賣了、不想賣了

②若無(wú)上述關(guān)鍵詞,則判斷語(yǔ)音時(shí)長(zhǎng),若時(shí)長(zhǎng)<1min,且包含下列關(guān)鍵詞,則認(rèn)為疑似成交:

不賣了、賣了、賣完、沒(méi)有了、撤了、下架、取消

2. 功能優(yōu)化

(1)狀態(tài)優(yōu)化:列表顯示狀態(tài)“未處理、已成交、未成交”3種。

(2)若一個(gè)房源有多條未處理的數(shù)據(jù),處理最近時(shí)間的一條,該房源所有之前未處理的數(shù)據(jù)狀態(tài)變更為相應(yīng)的狀態(tài),處理時(shí)間&處理人同理。

(3)列表刷新邏輯優(yōu)化:完成“審核”后不刷新列表,僅變更狀態(tài)、處理人、處理時(shí)間等相關(guān)數(shù)據(jù)。再次進(jìn)入菜單,才刷新整個(gè)頁(yè)面。

策略質(zhì)量評(píng)估

召回率、準(zhǔn)確率和誤判率分析

對(duì)上線后一天的數(shù)據(jù)進(jìn)行了分析,召回了26條數(shù)據(jù),其中12條命中成交,14條誤判,還有1條數(shù)據(jù)沒(méi)有識(shí)別出。

通過(guò)上面的數(shù)據(jù)發(fā)現(xiàn):增加非顯性關(guān)鍵詞+時(shí)間的識(shí)別,準(zhǔn)確率增加,但是也召回了很多非成交數(shù)據(jù),所以誤判率也增高。雖然滿足寧可錯(cuò)殺一千,也不能漏一個(gè)的原則,但還會(huì)拉更多的數(shù)據(jù)進(jìn)行分析,優(yōu)化時(shí)間維度的策略。

上述案例中,通過(guò)優(yōu)化關(guān)鍵詞策略,提高召回率,運(yùn)用了策略質(zhì)量評(píng)估方法,判斷召回造成的影響,下一步要降低誤判率。

在實(shí)際操作中,錄音轉(zhuǎn)文字的準(zhǔn)確度影響也很大(見上圖),我們也做了相關(guān)的數(shù)據(jù)統(tǒng)計(jì),在未識(shí)別數(shù)據(jù)中,有30%的數(shù)據(jù)屬于文字準(zhǔn)確度不高導(dǎo)致的,這個(gè)無(wú)法避免,機(jī)器對(duì)噪音的抗噪性不夠強(qiáng),另外,語(yǔ)音識(shí)別并沒(méi)有理解語(yǔ)義,若雙方都用方言講話,識(shí)別的準(zhǔn)確率會(huì)更低。

語(yǔ)音識(shí)別,在這幾年有了極大的發(fā)展,從算法到模型都有了質(zhì)的變化,在加上語(yǔ)音領(lǐng)域(語(yǔ)音合成等)的其他研究,語(yǔ)音技術(shù)陸續(xù)進(jìn)入工業(yè)、家庭機(jī)器人、通信、車載導(dǎo)航等各個(gè)領(lǐng)域中。本項(xiàng)目借助語(yǔ)音識(shí)別技術(shù)轉(zhuǎn)文字,再通過(guò)文字關(guān)鍵詞識(shí)別出成交房源,讓語(yǔ)音識(shí)別在房產(chǎn)市場(chǎng)得到應(yīng)用。

專欄作家

余田,人人都是產(chǎn)品經(jīng)理專欄作家,數(shù)據(jù)產(chǎn)品經(jīng)理,《用戶至上-用戶研究方法與實(shí)踐》譯者。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 我是不會(huì)給你這個(gè)權(quán)限的

    來(lái)自云南 回復(fù)
  2. 學(xué)習(xí)了~感覺(jué)還挺好玩

    來(lái)自北京 回復(fù)
  3. 學(xué)習(xí)了

    來(lái)自重慶 回復(fù)
    1. ?? 共同進(jìn)步

      來(lái)自遼寧 回復(fù)
专题
11924人已学习13篇文章
2023年已结束,你的年终总结写好了吗?本专题的文章分享了如何做好年终总结。
专题
31920人已学习17篇文章
你只知道它火了,却不知道它背后的内容营销秘籍。
专题
13508人已学习15篇文章
深度学习(Deep learning)是一种机器学习的分支,它是通过构建多层神经网络来实现自主学习和预测的能力。本专题的文章分享了解读深度学习。
专题
12218人已学习12篇文章
瑞幸咖啡和茅台的这次联名合作,无疑让联名营销这类营销方式又掀起了热度。本专题的文章分享了联名营销指南。
专题
13506人已学习11篇文章
生活中,难免会接到企业的一些外呼电话,无论是人工外呼还是AI外呼,其背后的外呼业务场景是什么?外呼系统包含哪些内容?本专题的文章分享了外呼系统的设计指南。
专题
18668人已学习12篇文章
如何设计出一个抓住他人眼球的feed流 ?feed流的组成元素以及常见的feed流样式?本专题的文章提供了对于feed流设计的思考。