如何讓ChatGPT更“懂你”
大語言模型并不是萬能的,由于缺乏行業(yè)領(lǐng)域的專業(yè)知識,大模型在解決實際問題上其實存在一定的局限性。那么,如何讓大模型更懂你?作者作為AI開發(fā)平臺的設(shè)計師,總結(jié)了兩個簡單高效的方法,一起來看。
我們都知道,生成式AI的出現(xiàn)掀起一波人工智能的浪潮,在這種時代背景下,了解AI產(chǎn)品背后的開發(fā)方法,能幫助我們更好的使用AI產(chǎn)品。
一、什么是生成式AI?
生成式AI可以幫助我們做很多事情,在日常生活中,它可以用于生成報告,提高匯報的效率;在電商領(lǐng)域,智能客服可以自動回答和解決用戶的問題;在醫(yī)療領(lǐng)域,智能醫(yī)生可以幫助患者進行疾病診斷,提高了行業(yè)人員的工作效率。
二、ChatGPT的本質(zhì)是大規(guī)模語言技術(shù)的應(yīng)用
在生成式AI應(yīng)用中,我們所熟悉的Open AI 的ChatGPT、百度的文心一言、字節(jié)的豆包等,他們的本質(zhì)是應(yīng)用了一種大模型的技術(shù)。
這種技術(shù)是由云廠商中專業(yè)的技術(shù)人員,通過海量的文本數(shù)據(jù)處理,消耗昂貴的算力成本所得到的。這樣的技術(shù)讓大模型學習人類的語言模式和知識結(jié)構(gòu),并生成自然流暢的回答。
大模型類比為大腦
通俗比喻:我們可以將大模型類比為“大腦”,大量的文本數(shù)據(jù)相當于“外界提供的信息”,昂貴的算法比喻為“聘請的高級教授”,將外界信息轉(zhuǎn)化為知識點,儲存在大腦中,最后呈現(xiàn)出來的就是我們使用的智能產(chǎn)品。
三、大語言模型并不是萬能的,解決實際問題上存在局限性
然而大語言模型并不是萬能的,由于缺乏行業(yè)領(lǐng)域的專業(yè)知識,導(dǎo)致他們在解決實際問題上存在一定的局限性。
比如以下場景:我想通過 文心一言 了解CXD智能云產(chǎn)品,相關(guān)的設(shè)計規(guī)則,而它的回答,并不能解決我的實際問題。
文心一言只提供適用于通用平臺的設(shè)計規(guī)則,這些規(guī)則并不能完全適用于我們的產(chǎn)品。企業(yè)應(yīng)用過程中遇到這種問題,應(yīng)該怎么辦?
四、解決辦法:讓人工智能應(yīng)用更懂你,得到你想要的內(nèi)容
作為AI開發(fā)平臺的設(shè)計師,我總結(jié)了兩個簡單高效的方法分享給大家。
方法1 “教它找”
“教它找”的原理是:通過加入提示詞,利用其中關(guān)鍵詞語,提示大模型理解我們的意圖,在已經(jīng)有的數(shù)據(jù)信息中找到我們想要信息再進行回答。
這種方式可以幫助我們低成本、快速的提升大模型的效果。
以開發(fā)一個“汽車銷售客服”作為場景,Diffy產(chǎn)品作為工具演示。
產(chǎn)品的左側(cè)面板是相關(guān)參數(shù)的配置,右側(cè)則是用戶真實使用場景的測試工具。
沒有提示語配置下,我選擇ChatGPT 3.5 來回答我的問題,發(fā)現(xiàn)它的回答沒有實質(zhì)有效的信息,對購買汽車的用戶幫助不大。
如何通過加入提示語提升質(zhì)量?
步驟1:加入提示詞:在左側(cè)面白的輸入框加入文本,限制大模型回答,讓大模型作為一名專業(yè)銷售人員,針對汽車性能、外觀等維度提供比對信息。
步驟2:測試效果:ChatGPT的回答效果明顯提升。
通過這樣的方式,打包成新的應(yīng)用,給到用戶使用,讓用戶在已限定好范圍的大模型內(nèi)進行問答,可以極大提高產(chǎn)品滿意度。
基于這個方法,我為大家推薦兩類好用的工具:一類是提示語模版平臺,在這些平臺中可以獲得各行各業(yè)的高質(zhì)量提示語,教育類、金融類等等,復(fù)制直接使用。
Dify:http://cloud.dify.ai/explore/apps
GPT short:http://prompt-shortcut.writeathon.cn
千帆大模型平臺:http://prompt-shortcut.writeathon.cn
方法2 “教他學”
“教他學”的原理是:通過增加自己/企業(yè)自身的數(shù)據(jù),與它自身通用的數(shù)據(jù)結(jié)合,教它學習新知識,從而定制一個懂你的新的大模型。
如何加入自己的數(shù)據(jù)?有兩種方式。
方式1:可以在AI定制的平臺,通過非結(jié)構(gòu)化的文檔(比如pdf word文檔、網(wǎng)頁鏈接等)資料,來生新的大模型。
方式2:選定某一AI開發(fā)平臺,準備結(jié)構(gòu)化的數(shù)據(jù)集(文本對信息)excel json文件,通過重新訓(xùn)練的方式,來讓大模型學習新知識。
同樣,我以兩個案例來介紹說明具體操作流程。
案例1:以開發(fā)“設(shè)計規(guī)范助手”為場景,Chatbase平臺作演示
第一步:選擇“創(chuàng)建機器人”。
第二步:選擇數(shù)據(jù),這里提供5種數(shù)據(jù)類型,分別是文檔、文本、連接、問答對、第三方筆記網(wǎng)址。
我提前準備好了三種關(guān)于日常會用到的文件,分別是:設(shè)計規(guī)范文檔、方案庫文檔、各產(chǎn)品的用研報告,同時加入專業(yè)的提示文本和云設(shè)中臺官網(wǎng)的鏈接,幫助大模型更好的學習我們的知識。
第三步:生成機器人開始測試。
通過三輪對話可以看到,它輕松的回答了我想要的問題,提供了正確的規(guī)范信息和健康度指標,以及如何設(shè)計數(shù)據(jù)標注場景的總結(jié)信息。
最后,只需要將它發(fā)布為網(wǎng)站,把鏈接提供給組內(nèi)設(shè)計師使用即可。
案例2:以開發(fā)“醫(yī)療客服助手”場景,千帆平臺作演示。
第一步:準備數(shù)據(jù),可以選擇自己準備數(shù)據(jù)集,按照平臺的示例引導(dǎo)進行操作;也可以直接使用平臺提供的現(xiàn)成的行業(yè)數(shù)據(jù)集。比如我們選擇這個醫(yī)療中文數(shù)據(jù)集。
第二步:訓(xùn)練模型,這個頁面中,首先選擇訓(xùn)練的大模型,可以根據(jù)大模型使用介紹進行選擇。我們選擇Ernie bot 因為它中文效果更好。
其次是選擇訓(xùn)練方法,不同的訓(xùn)練方法影響資源成本金額、消耗時間和模型穩(wěn)定性;最后是選擇訓(xùn)練參數(shù),平臺會根據(jù)已由信息提供推薦值,如果是開發(fā)人員對訓(xùn)練參數(shù)有了解,可以根據(jù)經(jīng)驗調(diào)整。點擊確定開始訓(xùn)練,
第三步:訓(xùn)練完成后則將任務(wù)發(fā)布為模型,并把模型部署為服務(wù)。(這里不詳細拓展)
第四步:在體驗中心中,選擇剛剛部署的服務(wù),即可進行測試,了解這個醫(yī)療客服的實際效果。
以上就是在大模型中加入結(jié)構(gòu)化數(shù)據(jù)的操作流程,這種方式需要耗費更多的金額和時間,但更適合于需要高精度回答效果的企業(yè)。
1)數(shù)據(jù)服務(wù)工具
這些平臺提供現(xiàn)成可用的數(shù)據(jù)集,就不用耗費精力去準備數(shù)據(jù),比如紅酒知識、動物知識等,根據(jù)你的業(yè)務(wù)需求下載使用。
阿里modelscope:http://www.modelscope.cn/datasets?Tags=text-classification&dataType=text&page=1
百度AI Studio:http://aistudio.baidu.com/datasetoverview
DataCastle:http://www.datacastle.cn/dataset_l
2)大模型調(diào)優(yōu)工具
國外的大模型調(diào)優(yōu)工具:谷歌、微軟。
最后總結(jié)
在過去,開發(fā)大模型的事情更多是專業(yè)的技術(shù)人員來做,而隨著時代的發(fā)展,未來AI可能將普惠到每個人。以后我們可能人人都會開發(fā)一個自己的大模型,用具有我們數(shù)據(jù)的機器人去工作、聊天。
而目前產(chǎn)品的使用流程仍存在門檻,對小白用戶的包容性不高,作為AI開發(fā)產(chǎn)品設(shè)計師,我們?nèi)沃囟肋h,一直在大模型開發(fā)流程做得簡單易用的路上持續(xù)努力~~
本文由 @MINGZI 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
寫得很好!