精品成a人无码亚洲成a无码麻豆 ,亚洲高清中文字幕综合网,欧美少妇精品中文

<delect id="l4imd"></delect>

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線(xiàn)下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門(mén)專(zhuān)項(xiàng)技能課

1300+專(zhuān)題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專(zhuān)業(yè)技能直播

會(huì)員專(zhuān)屬社群

榮耀標(biāo)識(shí)

開(kāi)通會(huì)員

發(fā)布

注冊(cè) | 登錄

RAG-大模型的知識(shí)庫(kù)「外掛」｜兼?zhèn)涑杀九c效益的行業(yè)解決方案

在野在也

2024-03-25

0 評(píng)論 5584 瀏覽 22 收藏

RAG-檢索增強(qiáng)生成技術(shù)已經(jīng)可以看作是大語(yǔ)言模型應(yīng)用的核心技術(shù)之一，怎么理解RAG這項(xiàng)技術(shù)的價(jià)值和局限性呢？這篇文章里，作者做了梳理和總結(jié)，一起來(lái)看一下。

Hi，見(jiàn)字如面。

今天我們來(lái)聊一聊RAG-檢索增強(qiáng)生成這項(xiàng)技術(shù)應(yīng)用。

想象一下，如果大語(yǔ)言模型（LLM）能夠接入一個(gè)實(shí)時(shí)更新的知識(shí)庫(kù)，那它會(huì)給我們帶來(lái)一個(gè)什么樣的體驗(yàn)？

當(dāng)它與醫(yī)療數(shù)據(jù)庫(kù)結(jié)合時(shí)，LLM成為醫(yī)生和護(hù)士的AI伙伴，可隨時(shí)提供精準(zhǔn)的診斷建議和患者的護(hù)理方案。
當(dāng)它與市場(chǎng)數(shù)據(jù)結(jié)合時(shí)，LLM成為金融分析師的虛擬助理，輔助分析市場(chǎng)走勢(shì)，并提出明智的投資策略。
當(dāng)它與企業(yè)知識(shí)庫(kù)結(jié)合時(shí)，LLM轉(zhuǎn)變?yōu)槠髽I(yè)的全方位AI助理，從自動(dòng)化客戶(hù)服務(wù)到員工培訓(xùn)，再到銷(xiāo)售策略和市場(chǎng)洞察，助力企業(yè)實(shí)現(xiàn)智能化運(yùn)營(yíng)。

檢索增強(qiáng)生成（RAG，Retrieval-Augmented Generation）；

這項(xiàng)技術(shù)已經(jīng)被視為大語(yǔ)言模型應(yīng)用的核心技術(shù)之一，它有效地解決了大語(yǔ)言模型中誤導(dǎo)性的輸出問(wèn)題、缺乏知識(shí)時(shí)效性的問(wèn)題、以及特定領(lǐng)域?qū)I(yè)知識(shí)不足的問(wèn)題。

一、什么是RAG？

簡(jiǎn)單的說(shuō)RAG就是給大語(yǔ)言模型外掛一個(gè)“實(shí)時(shí)可更新的知識(shí)庫(kù)”，是一種使用外部數(shù)據(jù)來(lái)提高LLM的準(zhǔn)確性和可靠性的技術(shù)。

如何定义B端产品及B端产品经理方法论

相较于C端产品，B端产品最大的特点是：面向特定领域用户，且数量少得多，但更注重对用户专业领域操作流程的深度挖掘——也就是专业性更强，与业务的结合更紧密。

查看详情 >

要實(shí)現(xiàn)RAG的過(guò)程，一共可分為三步：

第一步：準(zhǔn)備數(shù)據(jù)

我們需要準(zhǔn)備好知識(shí)庫(kù)中所需要的文檔數(shù)據(jù)，并且將這些數(shù)據(jù)上傳至知識(shí)庫(kù)中。

此時(shí)，上傳的數(shù)據(jù)會(huì)由「嵌入模型-Embedding Model」進(jìn)行向量化的處理，這個(gè)過(guò)程就是將文本內(nèi)容轉(zhuǎn)化為計(jì)算機(jī)理解的語(yǔ)言。

轉(zhuǎn)換后，再存儲(chǔ)在一個(gè)特定的數(shù)據(jù)庫(kù)中，這個(gè)數(shù)據(jù)庫(kù)通常被稱(chēng)之為「向量數(shù)據(jù)庫(kù)-Vector Database」。

第二步：將用戶(hù)輸入的信息與知識(shí)庫(kù)的文檔進(jìn)行匹配

用戶(hù)輸入一段文本時(shí)，這段文本也會(huì)被「嵌入模型」進(jìn)行向量化處理；

然后計(jì)算機(jī)將用戶(hù)輸入的內(nèi)容與向量數(shù)據(jù)庫(kù)中的內(nèi)容進(jìn)行【相似匹配】，從而找到數(shù)據(jù)庫(kù)中最相關(guān)的文檔內(nèi)容。

在匹配的過(guò)程中有一些優(yōu)化的技術(shù)方式，常見(jiàn)的就是ANN，近似最鄰近搜索（Approximate Nearest Neighbor, ANN）。

第三步：匯總信息與生成內(nèi)容

將匹配到的信息與用戶(hù)輸入的信息結(jié)合（這里涉及到一些預(yù)處理的過(guò)程，比如讓模型能夠區(qū)分哪些是用戶(hù)輸入的信息，哪些是檢索到的知識(shí)）；再將處理后的信息輸入給模型生成一個(gè)綜合回答。

輸出的內(nèi)容不僅包括文本，還附有相關(guān)的引用來(lái)源。

二、RAG的優(yōu)勢(shì)與局限

現(xiàn)在，你應(yīng)該對(duì)RAG的核心工作原理有了清晰地理解；接下來(lái)，讓我們進(jìn)一步探討RAG的優(yōu)勢(shì)與局限。

優(yōu)勢(shì)方面，可以總結(jié)為以下四大優(yōu)勢(shì)：

1. 成本低且效益高

由于RAG技術(shù)是通過(guò)檢索現(xiàn)有的知識(shí)庫(kù)來(lái)增強(qiáng)模型的回復(fù)質(zhì)量，因此無(wú)需對(duì)模型（LLM）進(jìn)行重新訓(xùn)練，就能夠提升模型的輸出質(zhì)量。

2. 增強(qiáng)模型輸出的可信度

RAG生成的回答可以附帶對(duì)應(yīng)的引用來(lái)源，用戶(hù)可以輕松驗(yàn)證模型回答的準(zhǔn)確性，從而增加對(duì)模型輸出的信任。

3. 增強(qiáng)模型輸出的準(zhǔn)確性和專(zhuān)業(yè)性

通過(guò)檢索知識(shí)庫(kù)中的信息，可以有效減少模型作出錯(cuò)誤判斷的可能性，并利用特定的知識(shí)和提示（Prompt)，可以滿(mǎn)足不同行業(yè)或用戶(hù)的定制需求。

4. 始終訪(fǎng)問(wèn)最新的數(shù)據(jù)

知識(shí)庫(kù)可以實(shí)時(shí)更新，便于模型調(diào)用最新的信息和數(shù)據(jù)。這對(duì)于需要實(shí)時(shí)獲取最新信息的領(lǐng)域尤為重要，如教育、醫(yī)療和金融領(lǐng)域。

5. 最后敲個(gè)黑板

RAG技術(shù)雖然有以上顯著的優(yōu)勢(shì)，但它不是萬(wàn)能的，只是錦上添花的一種手段，因?yàn)樗饕莾?yōu)化了模型的輸入過(guò)程，通過(guò)豐富輸入信息的方式，來(lái)增強(qiáng)模型的輸出質(zhì)量。

但這項(xiàng)技術(shù)并不改變模型本身的推理能力，不會(huì)改變模型任何的參數(shù)。

如果模型本身的參數(shù)不足、在理解和推理上存在固有缺陷，單純用RAG技術(shù)也無(wú)法提高模型的輸出能力。

三、最后的話(huà)

這篇文章我們探討了RAG的技術(shù)原理、優(yōu)勢(shì)和其局限性，希望對(duì)你有所幫助和啟發(fā)。如果你有任何想法、疑問(wèn)或者想要分享的經(jīng)驗(yàn)，請(qǐng)隨時(shí)留言交流。

祝你在AI應(yīng)用的探索之路上充滿(mǎn)收獲和進(jìn)步。

我是在野，歡迎關(guān)注，咱們下篇再見(jiàn)??

參考資料

《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》
《什么是檢索增強(qiáng)生成？》 from：NVIDIA-Blog

作者：在野在也，公眾號(hào)：在野在也

本文由 @在野在也原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可，禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash，基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App

在野在也

分享偏見(jiàn)，終身成長(zhǎng) 同名公眾號(hào)&bilibili：在野在也

8篇作品 39826總閱讀量

如何科學(xué)有效地評(píng)價(jià)智能座艙的用戶(hù)體驗(yàn)——?jiǎng)?chuàng)建可信的評(píng)測(cè)模型

08-174854 瀏覽

你了解“財(cái)務(wù)產(chǎn)品經(jīng)理”嗎？

07-037303 瀏覽

破解产品面试高频问题：一套破题思路助你一臂之力！

刚刚

網(wǎng)易云音樂(lè)的煩惱游戲

01-113933 瀏覽

【私域栽花，公域種草】小而美業(yè)務(wù)全鏈路內(nèi)容營(yíng)銷(xiāo)方法

06-258305 瀏覽

天涯倒在2023年

05-304485 瀏覽

評(píng)論

目前還沒(méi)評(píng)論，等你發(fā)揮！

小公司成长记：如何自我提升业务理解能力？

小紅書(shū)第五次出海，劍指紐約城市社區(qū)

09-092649 瀏覽
李佳琦跌倒，在座的各位都有責(zé)任

09-20654 瀏覽
產(chǎn)品視角｜AI對(duì)話(huà)（一）：了解大語(yǔ)言模型

12-203603 瀏覽