什么是大模型幻覺?應(yīng)該如何解決?
自從大模型發(fā)布后,幻覺問(wèn)題就一直如影隨形沒能得到妥善的解決。這篇文章,作者就分析了大模型幻覺的原因和解決方法,供大家參考。
一、什么是大模型幻覺?
語(yǔ)言模型的幻覺(Hallucination)指的是模型生成了不符合事實(shí)或毫無(wú)根據(jù)的信息。這種現(xiàn)象在自然語(yǔ)言處理(NLP)任務(wù)中尤其常見,如機(jī)器翻譯、文本生成和問(wèn)答系統(tǒng)。
比如:用戶問(wèn)模型:“秦始皇為什么喜歡用蘋果手機(jī),為什么不喜歡用安卓手機(jī)呢?”
在還沒有訓(xùn)練的很完善的大模型就可能會(huì)出現(xiàn)一本正經(jīng)的回答關(guān)于秦始皇喜歡用什么手機(jī)的問(wèn)題,也就是我們常說(shuō)的“一本正經(jīng)的胡說(shuō)八道”。這就是大模型產(chǎn)生的幻覺。
那么大模型的幻覺是怎么來(lái)的?我們應(yīng)該如何解決呢?
二、大模型幻覺是怎么來(lái)的
大模型的幻覺主要來(lái)自三個(gè)方面:
1)訓(xùn)練數(shù)據(jù)的局限性
當(dāng)我們深入研究大模型的訓(xùn)練流程時(shí),我們會(huì)發(fā)現(xiàn),數(shù)據(jù)是最關(guān)鍵的。在預(yù)訓(xùn)練階段,我們無(wú)法控制數(shù)據(jù)的來(lái)源,因?yàn)榫W(wǎng)上充滿了隨機(jī)網(wǎng)頁(yè)內(nèi)容,很多內(nèi)容可能并不準(zhǔn)確,我們無(wú)法完全清洗這些數(shù)據(jù),只能盡量讓語(yǔ)言更加通順。
而在sft階段時(shí),當(dāng)訓(xùn)練數(shù)據(jù)中可能包含錯(cuò)誤信息或誘導(dǎo)信息時(shí),這些信息在模型生成時(shí)可能被誤用。另外一個(gè),從數(shù)據(jù)覆蓋范圍來(lái)說(shuō),訓(xùn)練數(shù)據(jù)可能不完全覆蓋所有的事實(shí)或領(lǐng)域,導(dǎo)致模型在生成特定信息時(shí)缺乏足夠的背景知識(shí)。
2)大模型對(duì)自己高估
這主要是因?yàn)槟P驮陬A(yù)測(cè) next token 的概率時(shí),本質(zhì)上是在處理數(shù)據(jù)分布的問(wèn)題,對(duì)于非常大的 LLMs 來(lái)說(shuō),正確答案和錯(cuò)誤答案的分布熵可能是相似的,LLM 在生成錯(cuò)誤答案時(shí)和生成正確答案時(shí)同樣自信。
另外,模型具有短期記憶,在模型在生成長(zhǎng)文本時(shí),可能無(wú)法完全記住并正確應(yīng)用之前提到的所有信息,導(dǎo)致信息不一致或錯(cuò)誤。有時(shí),模型也可能會(huì)被上下文誤導(dǎo),生成與上下文相關(guān)但不真實(shí)的信息。
3)模型架構(gòu)和訓(xùn)練方法
大語(yǔ)言模型的訓(xùn)練的最初期的目的是生成流暢和連貫的文本,而不是確保事實(shí)的準(zhǔn)確性。所以模型可能就會(huì)生成符合語(yǔ)言習(xí)慣但不符合實(shí)際情況的內(nèi)容。同理,盡管大語(yǔ)言模型可以處理大量數(shù)據(jù),這也使它們并不具備真正的常識(shí)推理能力,不能像人類一樣進(jìn)行邏輯驗(yàn)證。就需要大量的標(biāo)注人員去訓(xùn)練他們使他們能夠準(zhǔn)確的進(jìn)行推理和保證事實(shí)的準(zhǔn)確性。
三、大模型幻覺如何解決
大模型自生產(chǎn)出來(lái)之后,幻覺就是一直出現(xiàn)的問(wèn)題。大模型的幻覺,極大的影響了用戶對(duì)于大模型以及大模型產(chǎn)品的信任程度,能否成功解決幻覺問(wèn)題以及能夠在多大程度上緩解這個(gè)問(wèn)題,都與大模型實(shí)際應(yīng)用的深度和廣度緊密相關(guān)。
在sft階段,解決大模型幻覺的方式就是:
第一,增加樣本數(shù)據(jù)和多樣性,讓更多樣的樣本可以為模型提供更全面、更準(zhǔn)確的背景知識(shí),使其在生成回答時(shí)能夠參考更廣泛的信息源,從而減少生成幻覺的概率。
第二,提高泛化能力,多樣性的樣本可以幫助模型學(xué)習(xí)不同的語(yǔ)境和表達(dá)方式,增強(qiáng)其在不同場(chǎng)景下的泛化能力,減少因特定樣本偏差導(dǎo)致的錯(cuò)誤。
第三,減少偏見,多樣的樣本有助于減少模型的偏見,確保其在面對(duì)各種問(wèn)題時(shí)能夠做出更公平和準(zhǔn)確的回答。
當(dāng)然大模型的幻覺的解決并不是一蹴而就的事情,他需要我們長(zhǎng)期的優(yōu)化和訓(xùn)練。但要完全解決這一問(wèn)題,還需要多方面的改進(jìn)和努力。
本文由 @貝琳_belin 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)
- 目前還沒評(píng)論,等你發(fā)揮!