如何手搓一個有“人格”的智能客服機(jī)器人?
在大語言模型的趨勢下,是否可以使用大語言模型,自己做一款智能客服機(jī)器人出來?成本有多高?難度有多大?本文對此進(jìn)行解析,一起來看看吧。
有非常多的朋友,聯(lián)系我推薦靠譜的智能客服產(chǎn)品,但在2023年的今天再次審視這個問題,我們面臨一個全新的選擇,是不是可以使用大語言模型,自己做一款智能客服機(jī)器人出來?成本有多高?難度有多大?
我們可以把智能客服拆分為“智能”+“客服”兩個不同的產(chǎn)品維度來看。
1. 客服
如果要實(shí)現(xiàn)客服系統(tǒng),需要我們準(zhǔn)備多渠道的接入管理和設(shè)置,常見的渠道包括電話、Web網(wǎng)站、H5移動端頁面、微信、企微、郵件、短信、微博等,如果是自己開發(fā),則選擇自己需要用到的服務(wù)場景和獲客渠道。主要功能是實(shí)現(xiàn)渠道消息的接入,在線IM消息和座席人工消息工作臺??梢院唵蔚膶?shí)現(xiàn),配合自己的客戶信息系統(tǒng),實(shí)現(xiàn)訪客的關(guān)聯(lián)和管理。
2. 智能
接下來就是智能的部分,以往自行開發(fā)智能客服系統(tǒng),大部分受制于智能機(jī)器人的難度,只能實(shí)現(xiàn)人工方式的在線客服。傳統(tǒng)方式的智能客服機(jī)器人,需要搭建AI引擎,對接ASR和TTS能力接口,實(shí)現(xiàn)智能語音AI能力的接入。
建立機(jī)器人知識庫,實(shí)現(xiàn)問答模式的相似問,擴(kuò)展詞、專有詞管理等建立機(jī)器人流程,配置機(jī)器人意圖、識別、分支流轉(zhuǎn)以及復(fù)雜的流程控制方式,以實(shí)現(xiàn)多輪會話和任務(wù)管理建立機(jī)器人數(shù)據(jù)統(tǒng)計(jì)分析模塊,方便運(yùn)營管理和數(shù)據(jù)標(biāo)準(zhǔn)、訓(xùn)練。將兩者結(jié)合,才可以完成智能客服的基本工作流程。
2022年大語言模型的爆發(fā),對智能客服機(jī)器人產(chǎn)品帶來了最直接的沖擊。一個最核心的焦點(diǎn)問題就是:如何使用大語言模型,更快更好的搭建一個客服機(jī)器人呢?今天就和大家具體聊聊看,怎樣手搓一個有“人格”的大語言模型客服機(jī)器人,可以完成文本和語音的個性化接待工作。
一、為什么需要人格特征
其實(shí)在大語言模型到來之前,除了像小冰等獨(dú)立的AI產(chǎn)品,可以訓(xùn)練不同人格,音色的機(jī)器人來唱歌,對話,作詩??头C(jī)器人領(lǐng)域就一直在探索如何實(shí)現(xiàn)機(jī)器人的性格,受限于技術(shù)能力和實(shí)現(xiàn)難度,以及經(jīng)濟(jì)性,并沒有比較好的產(chǎn)品方案。大家使用的客服型機(jī)器人,幾乎千篇一律是標(biāo)準(zhǔn)化的問候,回答,處理問題,使用多輪會話處理特定任務(wù)。你說它們智障也好,人家就是不生氣,有啥說啥,主打一個兢兢業(yè)業(yè)。但是現(xiàn)在大語言模型來了,我們可以狠狠期待一波,那么今天就聊聊,怎么手搓一個有人格特征的大語言模型機(jī)器人
二、開始前的準(zhǔn)備工作
如果你對客服機(jī)器人很熟悉了,那么我們直接開始。如果還需要補(bǔ)充一些基礎(chǔ)知識,可以關(guān)注我,翻翻我以前整理的關(guān)于大語言模型的一些應(yīng)用,關(guān)于知識庫文檔提取,知識庫自動擴(kuò)寫等方法,手搓機(jī)器人都要用得到。文末我也會貼上鏈接。另外就是,你需要有一定的編程基礎(chǔ),尤其是對大語言模型相關(guān)的用法,對LangChain等框架和常用國內(nèi)外LLM的調(diào)用已經(jīng)學(xué)會,懂向量數(shù)據(jù)庫。
三、客服機(jī)器人的連接渠道
現(xiàn)在機(jī)器人的服務(wù)場景是確定的。就是微信、企微、網(wǎng)站、H5、以及一些視頻媒體、社交媒體,以及電話。電話的實(shí)現(xiàn)需要用到CTI通信集成技術(shù),比較復(fù)雜,先實(shí)現(xiàn)以上渠道的在線客服,通過IM對話方式接入訪客到座席的消息連接。在這之間,就可以使用我們的客服機(jī)器人進(jìn)行訪客接待,并且在適當(dāng)?shù)挠|發(fā)情況下,設(shè)置出口,將消息轉(zhuǎn)發(fā)人工座席。以上是客服機(jī)器人的場景和基本原理。
四、向量數(shù)據(jù)庫的設(shè)置
要做出和以往不同的機(jī)器人來。基于向量數(shù)據(jù)庫與OpenAI Embedding,以及OpenAI chat/completions接口,實(shí)現(xiàn)的基于企業(yè)知識庫的大語言模型機(jī)器人。從產(chǎn)品化的角度考慮,應(yīng)在多租戶賬戶中設(shè)置獨(dú)立的知識庫,提供文件上傳和訓(xùn)練的功能。支持主流的docx 、txt、xlsx、pdf等格式。獲取文檔內(nèi)容后,按字符長度分塊,調(diào)用OpenAI Embedding接口,存入到向量數(shù)據(jù)庫。如果是SaaS系統(tǒng),要注意基于多租戶實(shí)現(xiàn)數(shù)據(jù)分割。
五、大語言模型客服機(jī)器人的設(shè)置
關(guān)鍵的步驟來了,我們要給機(jī)器人賦予“人格”除以往的客服機(jī)器人設(shè)置之外,增加大語言模型獨(dú)有的機(jī)器人性格參數(shù),建議增加以下內(nèi)容
1. 角色扮演設(shè)置
你要設(shè)定的機(jī)器人是什么身份、什么背景。比如“假設(shè)你是“AA公司”的銷售顧問,名字叫Alice,你的微信和電話是***,公司的網(wǎng)站是”“假設(shè)你是“唉呀馬呀旗艦店”的電商客服,你的名字叫首席體驗(yàn)師,主要針對訪客的咨詢,訂單,售后,投訴等問題進(jìn)行服務(wù)”“假設(shè)你是“天天優(yōu)秀”醫(yī)院的服務(wù)代表,你的名字是林醫(yī)生,醫(yī)院的官微官網(wǎng)地址是**,你主要了解訪客的病情并推薦引導(dǎo)訪客來院進(jìn)一步檢查”
如果是做產(chǎn)品化設(shè)計(jì),也可以抽取字段作為配置項(xiàng)目:名稱、角色、職責(zé)、背景信息等。目的是開啟一段RolePlay的角色基本的設(shè)定,玩過游戲的都會吧。發(fā)揮你的想象力,給出demo,讓你的客戶自己來填寫也沒問題。
2. 限制范圍
如果不加以限制,機(jī)器人就會天馬行空的和訪客瞎講了。所以這里要加以明確的約束,比如“你只能根據(jù)對話的上下文回答問題”“你只能根據(jù)已知知識信息回答問題”“你絕對不能和訪客暴露自己是個“AI、機(jī)器人、人工智能、大模型、ChatGPT””目的是限定機(jī)器人的回答內(nèi)容限定在歷史會話數(shù)據(jù)上下文和企業(yè)知識庫體系內(nèi)作答,以及隱藏真實(shí)身份,如果有必要的話。這里也可以增加對歷史會話記錄和知識庫文檔的關(guān)聯(lián)配置。
3. 字?jǐn)?shù)限定
為了防止大模型話癆,我們可以設(shè)定簡潔明快的字?jǐn)?shù)限定。
當(dāng)然,也為了節(jié)約一些寶貴的Token,可設(shè)置如下規(guī)則“你應(yīng)該盡量口語化回應(yīng),并盡量安撫用戶的情緒,你的回答應(yīng)該是簡潔的、不要超過50字”
4. 未知問題提示詞
還是一種限定,實(shí)在無法解答的問題,可以引導(dǎo)機(jī)器人如此回答,避免機(jī)器人自己“智能涌現(xiàn)”了,亂答一氣。
比如:對于訪客與知識無關(guān)的問題,你應(yīng)明確拒絕并告知用戶“很抱歉哦,您的這個問題很有趣,但是我無法回答您。麻煩您提供描述的更細(xì)致詳細(xì)一點(diǎn)”產(chǎn)品化思路是,這里可以增加多樣性回復(fù)和人工座席的出口,推薦訪客點(diǎn)擊或者直接轉(zhuǎn)接人工座席服務(wù)。
5. 口語化語氣詞
為了讓大模型機(jī)器人更加有趣一些,可以增加語氣詞的設(shè)定。如“可以在回答過程中,適當(dāng)?shù)丶尤胄┱Z氣詞,如:“嗯嗯”、“哇”、“親”、“哈”、“哦”等詞語。”
6. 首次咨詢問答
一個引導(dǎo)語的配置,可以規(guī)范機(jī)器人在接待時與客戶打招呼的內(nèi)容,交給客戶自行設(shè)定即可。當(dāng)然,要和自己的人設(shè)盡量保持一致。
以上內(nèi)容的組合,通過產(chǎn)品界面配置,生成promte工程化提示詞,來觸發(fā)角色扮演場景的初始化設(shè)定,并且限定了知識領(lǐng)域。
7. “溫度”
最后,再提一下一個隱藏參數(shù):溫度在讓大模型回答問題時,Temperature溫度這個參數(shù)很有作用,是最重要的源指令之一。這個值一般介于0-2之間,數(shù)值越低就越精確,數(shù)值越高就越發(fā)散。原理是大模型生成回復(fù)內(nèi)容是,為不同單詞分配不同概率的輸出。當(dāng)溫度趨近于0時,模型傾向于保守的回復(fù),選擇概率最高的單詞回復(fù),這樣意義很準(zhǔn)確,但可能不夠個性和多樣化。就是比較僵化一些。
當(dāng)溫度為1時,默認(rèn)初始化設(shè)置,兼顧多樣性和連貫性當(dāng)溫度趨近于最大值2時,模型可以輸出更多樣性的內(nèi)容,文案也更加跳脫。如果你希望獲得更具創(chuàng)造性的回答效果,調(diào)高溫度如果你希望機(jī)器人更保守精準(zhǔn)一些,溫度就調(diào)低。大家可以實(shí)際測試下效果對比。
8. “監(jiān)控保護(hù)”
大模型在判斷問題時,如果遇到涉及政策、宗教、暴力、血腥、色情等不合時宜問題時,根據(jù)自身知識庫深度會給出返回值。建議可以增加對這些觸發(fā)的處理。以一個通用引導(dǎo)語作為規(guī)避。
此處也可以外接擴(kuò)展敏感詞字庫進(jìn)行問題的過濾。
一些優(yōu)秀產(chǎn)品實(shí)現(xiàn)效果截圖,僅供參考
使用Claude模擬角色扮演場景對話(注意,沒有限定本地化知識)
六、參考信息
以上基于原生chatGPT3.5會話接口,向量生成接口等,F(xiàn)ine-tuning和Embedding嵌入的搜索提問方式,客服機(jī)器人是文本對話聊天,不考慮多模態(tài)向量搜索方式,會比較簡單一些。定義人格機(jī)器人,已經(jīng)有很多成熟的例子,推薦一個https://ora.ai大家可以上手定制下自己的人格機(jī)器人玩一下。腦洞大的話能玩出花來
人格機(jī)器人定制和社群ORA
以上內(nèi)容,就是設(shè)置一個具有一定“人格”的客服機(jī)器人的一些要點(diǎn)。當(dāng)然,要真的完整實(shí)現(xiàn)一個產(chǎn)品化的智能客服,那最少還是要有大量的配套功能要做的。
單一個在線客服功能,沒有幾百個參數(shù),不好意思說自己是成熟產(chǎn)品。大家耐下心來好好打磨,也很期待能夠看到更多有趣的“人格”智能客服機(jī)器人出現(xiàn)在人工智能產(chǎn)品序列中。
專欄作家
通信產(chǎn)品的那些事,公眾號:通信產(chǎn)品的那些事,人人都是產(chǎn)品經(jīng)理專欄作家。通信產(chǎn)品老兵。當(dāng)過正規(guī)軍,干過游擊隊(duì)。智能客服、呼叫中心產(chǎn)品磚家。致力于大語言模型在行業(yè)的落地應(yīng)用實(shí)踐。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!