RAG-大模型的知識(shí)庫(kù)「外掛」|兼?zhèn)涑杀九c效益的行業(yè)解決方案

0 評(píng)論 5584 瀏覽 22 收藏 7 分鐘
🔗 B端产品经理需要更多地关注客户的商业需求、痛点、预算、决策流程等,而C端产品经理需要更多地关注用户的个人需求

RAG-檢索增強(qiáng)生成技術(shù)已經(jīng)可以看作是大語(yǔ)言模型應(yīng)用的核心技術(shù)之一,怎么理解RAG這項(xiàng)技術(shù)的價(jià)值和局限性呢?這篇文章里,作者做了梳理和總結(jié),一起來(lái)看一下。

Hi,見(jiàn)字如面。

今天我們來(lái)聊一聊RAG-檢索增強(qiáng)生成這項(xiàng)技術(shù)應(yīng)用。

想象一下,如果大語(yǔ)言模型(LLM)能夠接入一個(gè)實(shí)時(shí)更新的知識(shí)庫(kù),那它會(huì)給我們帶來(lái)一個(gè)什么樣的體驗(yàn)?

  • 當(dāng)它與醫(yī)療數(shù)據(jù)庫(kù)結(jié)合時(shí),LLM成為醫(yī)生和護(hù)士的AI伙伴,可隨時(shí)提供精準(zhǔn)的診斷建議和患者的護(hù)理方案。
  • 當(dāng)它與市場(chǎng)數(shù)據(jù)結(jié)合時(shí),LLM成為金融分析師的虛擬助理,輔助分析市場(chǎng)走勢(shì),并提出明智的投資策略。
  • 當(dāng)它與企業(yè)知識(shí)庫(kù)結(jié)合時(shí),LLM轉(zhuǎn)變?yōu)槠髽I(yè)的全方位AI助理,從自動(dòng)化客戶(hù)服務(wù)到員工培訓(xùn),再到銷(xiāo)售策略和市場(chǎng)洞察,助力企業(yè)實(shí)現(xiàn)智能化運(yùn)營(yíng)。

檢索增強(qiáng)生成(RAG,Retrieval-Augmented Generation);

這項(xiàng)技術(shù)已經(jīng)被視為大語(yǔ)言模型應(yīng)用的核心技術(shù)之一,它有效地解決了大語(yǔ)言模型中誤導(dǎo)性的輸出問(wèn)題、缺乏知識(shí)時(shí)效性的問(wèn)題、以及特定領(lǐng)域?qū)I(yè)知識(shí)不足的問(wèn)題。

一、什么是RAG?

簡(jiǎn)單的說(shuō)RAG就是給大語(yǔ)言模型外掛一個(gè)“實(shí)時(shí)可更新的知識(shí)庫(kù)”,是一種使用外部數(shù)據(jù)來(lái)提高LLM的準(zhǔn)確性和可靠性的技術(shù)。

要實(shí)現(xiàn)RAG的過(guò)程,一共可分為三步:

第一步:準(zhǔn)備數(shù)據(jù)

我們需要準(zhǔn)備好知識(shí)庫(kù)中所需要的文檔數(shù)據(jù),并且將這些數(shù)據(jù)上傳至知識(shí)庫(kù)中。

此時(shí),上傳的數(shù)據(jù)會(huì)由「嵌入模型-Embedding Model」進(jìn)行向量化的處理,這個(gè)過(guò)程就是將文本內(nèi)容轉(zhuǎn)化為計(jì)算機(jī)理解的語(yǔ)言。

轉(zhuǎn)換后,再存儲(chǔ)在一個(gè)特定的數(shù)據(jù)庫(kù)中,這個(gè)數(shù)據(jù)庫(kù)通常被稱(chēng)之為「向量數(shù)據(jù)庫(kù)-Vector Database」。

第二步:將用戶(hù)輸入的信息與知識(shí)庫(kù)的文檔進(jìn)行匹配

用戶(hù)輸入一段文本時(shí),這段文本也會(huì)被「嵌入模型」進(jìn)行向量化處理;

然后計(jì)算機(jī)將用戶(hù)輸入的內(nèi)容與向量數(shù)據(jù)庫(kù)中的內(nèi)容進(jìn)行【相似匹配】,從而找到數(shù)據(jù)庫(kù)中最相關(guān)的文檔內(nèi)容。

在匹配的過(guò)程中有一些優(yōu)化的技術(shù)方式,常見(jiàn)的就是ANN,近似最鄰近搜索(Approximate Nearest Neighbor, ANN)。

第三步:匯總信息與生成內(nèi)容

將匹配到的信息與用戶(hù)輸入的信息結(jié)合(這里涉及到一些預(yù)處理的過(guò)程,比如讓模型能夠區(qū)分哪些是用戶(hù)輸入的信息,哪些是檢索到的知識(shí));再將處理后的信息輸入給模型生成一個(gè)綜合回答。

輸出的內(nèi)容不僅包括文本,還附有相關(guān)的引用來(lái)源。

二、RAG的優(yōu)勢(shì)與局限

現(xiàn)在,你應(yīng)該對(duì)RAG的核心工作原理有了清晰地理解;接下來(lái),讓我們進(jìn)一步探討RAG的優(yōu)勢(shì)與局限。

優(yōu)勢(shì)方面,可以總結(jié)為以下四大優(yōu)勢(shì):

1. 成本低且效益高

由于RAG技術(shù)是通過(guò)檢索現(xiàn)有的知識(shí)庫(kù)來(lái)增強(qiáng)模型的回復(fù)質(zhì)量,因此無(wú)需對(duì)模型(LLM)進(jìn)行重新訓(xùn)練,就能夠提升模型的輸出質(zhì)量。

2. 增強(qiáng)模型輸出的可信度

RAG生成的回答可以附帶對(duì)應(yīng)的引用來(lái)源,用戶(hù)可以輕松驗(yàn)證模型回答的準(zhǔn)確性,從而增加對(duì)模型輸出的信任。

3. 增強(qiáng)模型輸出的準(zhǔn)確性和專(zhuān)業(yè)性

通過(guò)檢索知識(shí)庫(kù)中的信息,可以有效減少模型作出錯(cuò)誤判斷的可能性,并利用特定的知識(shí)和提示(Prompt),可以滿(mǎn)足不同行業(yè)或用戶(hù)的定制需求。

4. 始終訪(fǎng)問(wèn)最新的數(shù)據(jù)

知識(shí)庫(kù)可以實(shí)時(shí)更新,便于模型調(diào)用最新的信息和數(shù)據(jù)。這對(duì)于需要實(shí)時(shí)獲取最新信息的領(lǐng)域尤為重要,如教育、醫(yī)療和金融領(lǐng)域。

5. 最后敲個(gè)黑板

RAG技術(shù)雖然有以上顯著的優(yōu)勢(shì),但它不是萬(wàn)能的,只是錦上添花的一種手段,因?yàn)樗饕莾?yōu)化了模型的輸入過(guò)程,通過(guò)豐富輸入信息的方式,來(lái)增強(qiáng)模型的輸出質(zhì)量。

但這項(xiàng)技術(shù)并不改變模型本身的推理能力,不會(huì)改變模型任何的參數(shù)。

如果模型本身的參數(shù)不足、在理解和推理上存在固有缺陷,單純用RAG技術(shù)也無(wú)法提高模型的輸出能力。

三、最后的話(huà)

這篇文章我們探討了RAG的技術(shù)原理、優(yōu)勢(shì)和其局限性,希望對(duì)你有所幫助和啟發(fā)。如果你有任何想法、疑問(wèn)或者想要分享的經(jīng)驗(yàn),請(qǐng)隨時(shí)留言交流。

祝你在AI應(yīng)用的探索之路上充滿(mǎn)收獲和進(jìn)步。

我是在野,歡迎關(guān)注,咱們下篇再見(jiàn)??

參考資料

  1. 《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》
  2. 《什么是檢索增強(qiáng)生成?》 from:NVIDIA-Blog

作者:在野在也,公眾號(hào):在野在也

本文由 @在野在也 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!