“賈維斯”這類智能助手,已經(jīng)看到落地的可能性了
近段時(shí)間以來(lái),隨著ChatGPT這類大模型的火熱,引發(fā)了各行各業(yè)的變革,也讓我們不禁設(shè)想是否能夠創(chuàng)造一個(gè)“賈維斯”這類智能助手。本文總結(jié)分析了類似產(chǎn)品,探討“賈維斯”這類智能助手的落地可能性。
作為一個(gè)普通人,我曾經(jīng)設(shè)想過(guò),如果能有一個(gè)類似與鋼鐵俠的智能助力“賈維斯”來(lái)幫助自己成為一個(gè)全能小助手,那是多么科幻的一個(gè)事。
最近半年,隨著ChatGPT這類大模型的火熱,引發(fā)了各行各業(yè)的變革,其中有智能問(wèn)答類的,文章等宣傳文案生成類的、還有結(jié)合midjourney這類能力的衍生最近半個(gè)月則是顯得更加智能化的autoGPT的誕生。讓我覺(jué)得想要去打造一個(gè)“賈維斯”也是有可能的。
首先我們就想要實(shí)現(xiàn)這個(gè)目標(biāo),進(jìn)行一下需求與功能模塊的拆分,以我目前的理解,可以拆分為【ChatGPT】+【數(shù)字人】+【PRA】來(lái)實(shí)現(xiàn)。
接下來(lái)細(xì)說(shuō)一下這3塊分別具備什么能力以及主要實(shí)現(xiàn)的功能作用:首先就【ChatGPT】、【數(shù)字人】、【PRA】進(jìn)行一下基礎(chǔ)的科普:
1. ChatGPT (Generative Pre-trained Transformer)
能用像模像樣的“人話”來(lái)回答幾乎任何領(lǐng)域的用戶問(wèn)題,并對(duì)上下文有一定程度的理解。ChatGPT不僅會(huì)聊天,還可以幫助人類寫(xiě)代碼、修復(fù)bug、寫(xiě)工作周報(bào)、寫(xiě)小說(shuō)、進(jìn)行考試答題、繪畫(huà)、看病以及大幅度提高搜索效率和體驗(yàn)等。
強(qiáng)大的優(yōu)勢(shì):
- 它已經(jīng)經(jīng)過(guò)數(shù)百萬(wàn)句子的預(yù)訓(xùn)練,并且在多項(xiàng)自然語(yǔ)言處理任務(wù)中取得了最先進(jìn)的結(jié)果。它能夠流暢地產(chǎn)生自然語(yǔ)言響應(yīng),有效地響應(yīng)用戶的疑問(wèn)和請(qǐng)求。
- 多個(gè)處理單元同時(shí)工作來(lái)處理多個(gè)用戶請(qǐng)求,可以在短時(shí)間內(nèi)處理大量的請(qǐng)求,為用戶提供快速而高效的響應(yīng)。
- 是基于預(yù)訓(xùn)練的模型,并使用大量的數(shù)據(jù)進(jìn)行訓(xùn)練,因此其學(xué)習(xí)到的知識(shí)是通用的,可以適用于不同的業(yè)務(wù)場(chǎng)景。此外,還進(jìn)行了嚴(yán)格的指標(biāo)監(jiān)測(cè)和數(shù)據(jù)收集,以確保ChatGPT提供一致且可重復(fù)的響應(yīng)質(zhì)量。
2. 數(shù)字人
是一種使用計(jì)算機(jī)生成的圖像、聲音和方法來(lái)模擬人類交互的系統(tǒng)。
其特點(diǎn)和優(yōu)勢(shì)如下:
- 逼真的表現(xiàn)力:虛擬數(shù)字人采用高級(jí)計(jì)算機(jī)圖形學(xué)技術(shù),其外觀和聲音都可以被設(shè)計(jì)得與真實(shí)人類非常相似。虛擬數(shù)字人能夠模擬真實(shí)人類情感,語(yǔ)言和動(dòng)作,無(wú)論是在視聽(tīng)上還是在交互上,都能產(chǎn)生高度逼真的效果。
- 可定制性強(qiáng):由于使用計(jì)算機(jī)生成的系統(tǒng),虛擬數(shù)字人可以在控制臺(tái)上輕松進(jìn)行定制和編輯,包括其外觀、聲音、交互方式和應(yīng)用場(chǎng)景等。因此,用戶可以為其特定的應(yīng)用領(lǐng)域和客戶而定制虛擬數(shù)字人方案,從而提高交互的效率和滿足需求的多樣性。
- 成本低廉:與雇用真實(shí)人類的費(fèi)用相比,虛擬數(shù)字人的成本更低廉,而且它們可以在全天候和全年范圍內(nèi)運(yùn)行,不受固定的時(shí)間和地點(diǎn)限制,從而為企業(yè)節(jié)省了大量的成本,并且能夠提供更高效的客戶服務(wù)。
- 擴(kuò)展性:通過(guò)設(shè)計(jì)和定制虛擬數(shù)字人的語(yǔ)義和交互方式,可以擴(kuò)展虛擬數(shù)字人的功能和應(yīng)用領(lǐng)域。例如,虛擬數(shù)字人可以作為客戶服務(wù),智能家居,娛樂(lè)等領(lǐng)域的智能助手,實(shí)現(xiàn)與人類的高效互動(dòng)和交流。
- 支持多語(yǔ)言和跨文化交互:虛擬數(shù)字人的聲音可以通過(guò)技術(shù)手段實(shí)現(xiàn)多語(yǔ)種,并且設(shè)計(jì)技術(shù)也能考慮到文化差異。這使得虛擬數(shù)字人能夠成為全球商業(yè)和社交交互中的全球級(jí)參與者。
3. PRA-機(jī)器人流程自動(dòng)化(Robotic process automation)
以軟件機(jī)器人及人工智能(AI)為基礎(chǔ)的業(yè)務(wù)過(guò)程自動(dòng)化應(yīng)用程序,通過(guò)模仿最終用戶在電腦的手動(dòng)操作方式,提供了另一種方式來(lái)使最終用戶手動(dòng)操作流程自動(dòng)化。
使符合某些適用性標(biāo)準(zhǔn)的基于桌面的業(yè)務(wù)流程和工作流程實(shí)現(xiàn)自動(dòng)化,自動(dòng)化工具(如屏幕抓取工具、Excel宏、業(yè)務(wù)流程自動(dòng)化管理等),一般來(lái)說(shuō)這些操作在很大程度上是重復(fù)的,數(shù)量比較多的,并且可以通過(guò)嚴(yán)格的規(guī)則和結(jié)果來(lái)定義。
一、類似【智能助手】產(chǎn)品設(shè)計(jì)舉例
初步設(shè)想的業(yè)務(wù)邏輯如下:
以【給XX郵箱或者手機(jī)號(hào)碼發(fā)送內(nèi)容】為例(如下為業(yè)務(wù)流程說(shuō)明):
- 用戶可以通過(guò)語(yǔ)音或者文本輸入一些問(wèn)題或指令;
- 這些內(nèi)容會(huì)被發(fā)送到chatgpt服務(wù)API中獲取答案;
- 在獲取答案之后,答案文本會(huì)被調(diào)用TTS服務(wù)的能力進(jìn)行語(yǔ)音合成;
- 數(shù)字人會(huì)獲取到TTS合成的文本內(nèi)容,并在客戶端進(jìn)行語(yǔ)音播報(bào);
- 然后TTS會(huì)將相關(guān)指令通過(guò)RPA同步給郵件服務(wù)/短信服務(wù);
- RPA收到指令后會(huì)按照指令去做相應(yīng)的操作,并將結(jié)果返回給客戶端;
- 客戶端獲取操作結(jié)果后,將結(jié)果轉(zhuǎn)化為文本輸出給TTS;
- TTS同步給數(shù)字人;
- 在客戶端進(jìn)行語(yǔ)音播報(bào)告知用戶結(jié)果;
目前網(wǎng)上已經(jīng)有相關(guān)同學(xué)做了一個(gè)視頻,初步可以看出其效果,如下:
1)對(duì)接語(yǔ)音輸入模塊,支持語(yǔ)音輸入與文本輸入:
2)基于chatgpt進(jìn)行回復(fù)
3)發(fā)起業(yè)務(wù)同步,相關(guān)發(fā)送到手機(jī)端:
4)完成業(yè)務(wù)需求的交互
看到這,是不是發(fā)現(xiàn)其實(shí)想要實(shí)現(xiàn)搭建一個(gè)“賈維斯”好像已經(jīng)是可以觸摸到的了。
二、基于以上的運(yùn)用思路,再發(fā)散一下
以PRA多對(duì)接一些應(yīng)用的情況下,或者對(duì)接一些專有的NLP等其他應(yīng)用,在很多實(shí)現(xiàn)落地方面是不是可以有更多的想象空間:
1. 針對(duì)個(gè)人用戶的助理類產(chǎn)品
可以根據(jù)用戶需求和習(xí)慣,提供更為智能、個(gè)性化與專業(yè)的服務(wù)。 借助一系列的高效工具,能夠幫助人們更好地管理自己的生活并且讓生活變得更加美好和方便。
私人超級(jí)管家:
目前很多家庭的家電等設(shè)備都是智能化的,那么就可以通過(guò)語(yǔ)音交互幫助用戶完成很多基礎(chǔ)的事務(wù),例如調(diào)節(jié)房間溫度、打開(kāi)窗戶、查找信息,或者發(fā)起一次語(yǔ)音通話等。
舉個(gè)具象一點(diǎn)的例子:比如在夏天時(shí),室外氣溫很高,當(dāng)你工作了一天準(zhǔn)備下班回家,這個(gè)時(shí)候,他就出現(xiàn)在手機(jī)上來(lái)咨詢你,是否需要幫你提前開(kāi)啟汽車的空調(diào),并調(diào)整到多少的車內(nèi)溫度,在開(kāi)車回家前,基于是否在外面進(jìn)行吃飯以及是否有其他行程安排,規(guī)劃好最合適的路線,并在車內(nèi)設(shè)定好導(dǎo)航。另外,在解答一些疑問(wèn)和提供如搜索特定內(nèi)容、聽(tīng)取音樂(lè)、收聽(tīng)新聞等,也能是一個(gè)合格的智能管家。
通過(guò)最初的系統(tǒng)設(shè)定,以及對(duì)用戶的日常行為進(jìn)行分析和學(xué)習(xí),能自動(dòng)幫服務(wù)對(duì)象規(guī)劃日程,包括會(huì)議安排、旅行計(jì)劃等等,并提醒用戶收看日程變更等此類服務(wù)。
文案專員到視頻剪輯再到生成視頻:
基于ChatGPT本身文案生成的能力,在確定完內(nèi)容的核心主題后,先生成文案的核心框架,再通過(guò)框架的提綱,生成框架下的集體內(nèi)容,不僅可以直接從無(wú)到有,也可以是在一定內(nèi)容的基礎(chǔ)上在進(jìn)行潤(rùn)色有優(yōu)化。在通過(guò)指令的形式,將生成好的文案直接導(dǎo)入到類似剪映此類可以通過(guò)文案直接生成視頻的軟件中,從而實(shí)現(xiàn)從大綱-文章輸出-視頻制作-發(fā)布自動(dòng)化流水線的快速生成。
當(dāng)然,按照目前當(dāng)前的生成文案也好,需要基于很好的角色設(shè)定、基礎(chǔ)內(nèi)容輸入,ChatGPT類才會(huì)有高質(zhì)量的產(chǎn)出。另外自動(dòng)生成的視頻也需要二次加工才能真正做到一個(gè)看起來(lái)比較連貫并且能表達(dá)清楚基本思路的一個(gè)視頻。
數(shù)據(jù)分析專家:
全天候的待機(jī)與支持情況下,幫助用戶更方便地分析相關(guān)的數(shù)據(jù)和統(tǒng)計(jì),比如家庭財(cái)務(wù)預(yù)算、運(yùn)動(dòng)指標(biāo)計(jì)算、睡眠監(jiān)測(cè)等。以幫助用戶制定家庭財(cái)務(wù)預(yù)算舉例:
首先,可以為用戶提供一個(gè)移動(dòng)應(yīng)用程序,讓他們輸入他們的日常開(kāi)銷和收入,例如購(gòu)物、房租、電話賬單和工資。在這種情況下,再根據(jù)這些數(shù)據(jù)執(zhí)行以下操作:
- 通過(guò)自學(xué)習(xí)的算法對(duì)數(shù)據(jù)進(jìn)行分類和處理,例如自動(dòng)識(shí)別不同種類的支出和收入,同時(shí)去除重復(fù)或無(wú)效的數(shù)據(jù)。
- 針對(duì)用戶家庭預(yù)算的需要,自動(dòng)分析該用戶的數(shù)據(jù),例如分析每個(gè)月的開(kāi)銷、品類占比,以及列出預(yù)算中的可支配收入。
- 幫助用戶識(shí)別一些有利的模式,例如指出某些支出的比例過(guò)高,或者某些開(kāi)銷具有明顯的周期性變化,并作為指標(biāo)項(xiàng)進(jìn)行標(biāo)記。
- 如果需要更好的視覺(jué)顯示效果,也可以通過(guò)數(shù)據(jù)可視化工具,將數(shù)據(jù)呈現(xiàn)出來(lái),例如把收入和支出用圖表或餅狀圖呈現(xiàn),讓用戶容易看懂。
- 最后在基于以上的收支情況,進(jìn)而制定出更合理和靈活的財(cái)務(wù)預(yù)算計(jì)劃以及建議。
將人工智能系統(tǒng)應(yīng)用于金融行業(yè),可以幫助企業(yè)和個(gè)體投資者更精準(zhǔn)的進(jìn)行投資與風(fēng)險(xiǎn)控制、監(jiān)測(cè)市場(chǎng)走勢(shì),提高相關(guān)業(yè)務(wù)線的效率以及為客戶提供更便捷的服務(wù)。
風(fēng)控方面:
假設(shè)有一個(gè)銀行正在使用類似chatgpt這類大模型來(lái)提高其風(fēng)險(xiǎn)管理能力??梢詮亩鄠€(gè)數(shù)據(jù)源中收集信息,例如客戶開(kāi)戶信息、信用評(píng)估數(shù)據(jù)、交易歷史記錄、市場(chǎng)數(shù)據(jù)等。再可以對(duì)這些數(shù)據(jù)進(jìn)行分析,并根據(jù)自身的算法自主處理和提取重要信息。
在風(fēng)險(xiǎn)管理方面,就可以幫助銀行完成以下任務(wù):
- 評(píng)估潛在風(fēng)險(xiǎn):可以快速分析和處理大量數(shù)據(jù),以識(shí)別和評(píng)估潛在的風(fēng)險(xiǎn),例如個(gè)人或企業(yè)的財(cái)務(wù)困境,交易異?;蛐庞每ㄆ墼p等。這將使銀行更快地發(fā)現(xiàn),并通過(guò)適當(dāng)?shù)拇胧┓乐够蚪鉀Q潛在的風(fēng)險(xiǎn)問(wèn)題。
- 自動(dòng)化決策:可以根據(jù)預(yù)設(shè)規(guī)則和算法自動(dòng)化地做出決策,例如自動(dòng)拒絕不良信用記錄的客戶,或者自動(dòng)限制某些類型的交易。這樣銀行客服即使在非工作時(shí)間也可以自動(dòng)地解決問(wèn)題,提高了客戶服務(wù)效率。
- 非線性建模:在風(fēng)險(xiǎn)管理中非常有用,因?yàn)樗鼈兛梢岳梅蔷€性建模方法,更好地應(yīng)對(duì)復(fù)雜和不確定的領(lǐng)域。例如,新興的業(yè)務(wù)或市場(chǎng)領(lǐng)域,因?yàn)樾畔⒉蛔慊蜃兓焖?,可以使用大模型?lái)進(jìn)行非線性建模以預(yù)測(cè)未來(lái)趨勢(shì)。
財(cái)富助手方面:
市場(chǎng)上原本存在的許多金融產(chǎn)品,包含股票債券的定價(jià)和交易受制于信息不對(duì)稱的情況,基于此,【ChatGPT】+【數(shù)字人】+【PRA】等APGC能力,可以幫助財(cái)富顧問(wèn)實(shí)現(xiàn)更高效、更準(zhǔn)確地提供專業(yè)服務(wù),提出更好的投資計(jì)劃或優(yōu)化方案,以及更好地監(jiān)測(cè)市場(chǎng)趨勢(shì)和潛在風(fēng)險(xiǎn)。
舉個(gè)例子:
- 量身定制方案:可以針對(duì)每位客戶的獨(dú)特需求、背景和風(fēng)險(xiǎn)承受能力,創(chuàng)建個(gè)性化的投資組合方案。在考慮客戶收入、年齡、婚姻狀況、風(fēng)險(xiǎn)投資偏好等因素后,大模型可以自動(dòng)創(chuàng)建出投資方案,以確??蛻羰找孀畲蠡?。
- 動(dòng)態(tài)優(yōu)化:可以通過(guò)數(shù)據(jù)分析來(lái)識(shí)別市場(chǎng)機(jī)會(huì)和潛在風(fēng)險(xiǎn),對(duì)客戶的投資組合進(jìn)行動(dòng)態(tài)優(yōu)化調(diào)整,分析大量的市場(chǎng)數(shù)據(jù)并預(yù)測(cè)未來(lái)市場(chǎng)動(dòng)向, 讓投資者能更好地制定投資策略和風(fēng)險(xiǎn)控制策略。實(shí)時(shí)監(jiān)控國(guó)際貨幣、利率等經(jīng)濟(jì)數(shù)據(jù),對(duì)企業(yè)財(cái)務(wù)、投資組合等進(jìn)行跟蹤和監(jiān)測(cè)并給出實(shí)時(shí)提示和預(yù)警,從而幫助企業(yè)決策者及時(shí)調(diào)整策略。例如,如果市場(chǎng)出現(xiàn)某些風(fēng)險(xiǎn),可以及時(shí)調(diào)整該客戶的股票組合并增加投資基金和貨幣市場(chǎng)基金的分配。
- 高效交易:可以利用機(jī)器學(xué)習(xí)和自然語(yǔ)言處理技術(shù)來(lái)預(yù)測(cè)市場(chǎng)趨勢(shì)和交易機(jī)會(huì),根據(jù)收集到的數(shù)據(jù)預(yù)測(cè)行情,以便幫助財(cái)富顧問(wèn)更快速地做出決策。例如,大型模型可以分析歷史數(shù)據(jù)、市場(chǎng)新聞或公司報(bào)告,并預(yù)測(cè)某些股票的未來(lái)表現(xiàn),財(cái)富顧問(wèn)可以據(jù)此來(lái)做出決策。
- 風(fēng)險(xiǎn)控制:可以通過(guò)持續(xù)的風(fēng)險(xiǎn)管理來(lái)控制客戶的風(fēng)險(xiǎn)水平。通過(guò)跟蹤客戶投資組合中的資產(chǎn)分配、固定收益證券、股票與股票總市值之比、持倉(cāng)期限以及其他指標(biāo)等,模型可以確定潛在風(fēng)險(xiǎn)并提出建議,以便財(cái)富顧問(wèn)與客戶共同控制風(fēng)險(xiǎn)。
智能客服:
如同上文中,類似【智能助手】產(chǎn)品,銀行行業(yè)可以提供24小時(shí)全天候智能服務(wù),基于已有的NLP或者知識(shí)庫(kù)效用,對(duì)金融知識(shí)的專業(yè)講解、基礎(chǔ)客戶服務(wù)、理財(cái)產(chǎn)品的智能推薦回復(fù)等,可以實(shí)現(xiàn)步驟流程的規(guī)范化以及標(biāo)準(zhǔn)哈。
- 自動(dòng)化問(wèn)題解答:可以利用自然語(yǔ)言處理和機(jī)器學(xué)習(xí)技術(shù)來(lái)學(xué)習(xí)客戶請(qǐng)求的語(yǔ)言以及常見(jiàn)的問(wèn)題,它們通過(guò)分析大量的數(shù)據(jù)來(lái)識(shí)別常見(jiàn)問(wèn)題的關(guān)鍵字、句式等,訓(xùn)練出智能客服機(jī)器人來(lái)自動(dòng)解答客戶的問(wèn)題,減少需要人工干預(yù)的量,提高客戶服務(wù)的效率。
- 提供超預(yù)期體驗(yàn):智能客服機(jī)器人可以利用大型模型技術(shù),自學(xué)習(xí)人類學(xué)習(xí)到的經(jīng)驗(yàn),并將在相近情境下所學(xué)到的知識(shí)應(yīng)用于更復(fù)雜的情況。例如,客戶詢問(wèn)交易信息,大型模型可以幫助智能客服機(jī)器人了解該客戶的交易和需求信息,提高客戶體驗(yàn)。
- 利用數(shù)據(jù)優(yōu)化服務(wù):可以利用自己分析大量數(shù)據(jù)的能力,從客戶歷史數(shù)據(jù)中發(fā)現(xiàn)不同級(jí)別的服務(wù)需求。例如,如果客戶詢問(wèn)較基礎(chǔ)的問(wèn)題,那么智能客服機(jī)器人可以通過(guò)自學(xué)習(xí)來(lái)為客戶提供更細(xì)致的答案,而非僅僅給出基礎(chǔ)的答案。
- 數(shù)字人的形象可以以更加生動(dòng)的形象吸引客戶的注意,同時(shí)也可以利用顏色和音樂(lè)等元素,呈現(xiàn)出更加詳細(xì)、更有說(shuō)服力的解釋,幫助客戶更好地理解一些復(fù)雜的金融概念和標(biāo)準(zhǔn)。
結(jié)語(yǔ)
以上是本人對(duì)于數(shù)字人+大模型+RPA集合后運(yùn)用的一些想法與思路分享。
如有不合理或不正確的,歡迎指正~
本文由 @毅鳴 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!