大模型再怎么“胡說八道”,也不像人類的胡說八道那么惡劣

0 評(píng)論 411 瀏覽 0 收藏 29 分鐘
🔗 技术知识、行业知识、业务知识等,都是B端产品经理需要了解和掌握的领域相关的知识,有助于进行产品方案设计和评估

隨著生成式AI的崛起,大模型的“胡說八道”(即“大模型幻覺”)引發(fā)了廣泛爭(zhēng)議,許多人擔(dān)心它會(huì)污染互聯(lián)網(wǎng)信息生態(tài),甚至摧毀人類的知識(shí)體系。本文作者通過親身經(jīng)歷和多個(gè)生動(dòng)案例,揭示了一個(gè)更深刻的事實(shí):人類自身的胡說八道能力遠(yuǎn)勝于大模型,且其影響更為惡劣。

自從生成式AI崛起以來,經(jīng)常有人傳播一個(gè)觀點(diǎn):AI大模型的“胡說八道”(學(xué)名是“大模型幻覺”)會(huì)導(dǎo)致整個(gè)互聯(lián)網(wǎng)充斥垃圾信息,最終毀掉人類的知識(shí)體系。當(dāng)初ChatGPT爆紅之后,以及最近DeepSeek爆紅之后,都有大量的專業(yè)媒體和自媒體,像鸚鵡學(xué)舌一樣,不斷重復(fù)著上述說法。就在昨天,我的朋友圈里又有好幾個(gè)人轉(zhuǎn)發(fā)了類似的文章。鑒于這類文章內(nèi)容大同小異,看個(gè)標(biāo)題就知道內(nèi)文在寫什么了,所以我沒有打開閱讀,今后應(yīng)該也不會(huì)閱讀。

作為一個(gè)GPT/DeepSeek的雙料重度用戶,我當(dāng)然知道“大模型幻覺”的威力。我是歷史學(xué)愛好者,經(jīng)常跟AI討論歷史問題,要求AI幫我收集史料。大約半年前,我問了GPT-4o一個(gè)問題:“清朝初年的佟佳氏家族,在康熙年間一度有‘佟半朝’之稱,但是自從雍正年間隆科多被查辦、乾隆年間慶復(fù)被賜死之后,似乎就遠(yuǎn)離歷史舞臺(tái)了。這個(gè)家族在清朝中后期還出過名人嗎?”

十幾秒后,GPT-4o告訴我:“隆科多、慶復(fù)先后獲罪之后,佟佳氏確實(shí)大不如前,但是瘦死的駱駝比馬大,還是出了一些中高層官員,例如:乾隆時(shí)期的副都統(tǒng)佟世榮、晚清的內(nèi)務(wù)府官員佟永德、晚清的八旗領(lǐng)隊(duì)大臣佟志和等。在此附上他們的簡歷(下略)。”

我馬上發(fā)覺不對(duì)勁:佟佳氏是一個(gè)“滿洲化”程度很深的漢軍旗家族,起名習(xí)慣也逐漸采納了滿洲的“稱名不舉姓”,像隆科多、慶復(fù)都是很典型的滿洲人名,怎么到了晚清反而全是漢化姓名?而且,諸如佟永德、佟志和之流,不但《清史稿》查無此人,在所有主流搜索引擎都搜不到。于是我再次詢問:“你說的這幾個(gè)人,我沒有找到任何相關(guān)史料,你的信息來源是什么?”

GPT-4o宣稱自己的信息來源是《清史稿》和《八旗通志》。我明確表示,在這兩部書中找不到上面幾個(gè)名字,于是它終于認(rèn)錯(cuò)了:“不好意思,這些人在歷史上確實(shí)不存在。佟佳氏在清朝中期以后確實(shí)沒有出現(xiàn)值得一提的人物?!睙o論如何,我還是基本達(dá)到了目的,盡管我差一點(diǎn)點(diǎn)就上當(dāng)了。

在想象力之深厚、編段子之狂野方面,DeepSeek似乎比GPT有過之而無不及,這可能是由于其對(duì)齊機(jī)制(Alignment)與GPT不同。所以有些人很喜歡讓DeepSeek寫小說、寫同人文;但由于個(gè)人審美口味不同,我對(duì)它編的故事不太感冒,還是更喜歡看GPT編故事。如果我們隱去這些故事的虛構(gòu)屬性,把它當(dāng)做真實(shí)資料貼到網(wǎng)上,確實(shí)能夠騙住一大批人,就連相關(guān)領(lǐng)域的專業(yè)人士也難以免俗。

由此回到了本文開頭的那個(gè)問題:大模型如此擅長“一本正經(jīng)地胡說八道”,它會(huì)毀掉人類的知識(shí)體系嗎?

我的答案很簡單:人類的知識(shí)體系還輪不到大模型來摧毀,因?yàn)槿祟愖约汉f八道的能力遠(yuǎn)勝于大模型,其影響也遠(yuǎn)遠(yuǎn)更惡劣。大模型只是胡說八道的效率比較高,人類則早已把胡說八道發(fā)展成了一種“藝術(shù)”,不僅是一本正經(jīng)地胡說八道,而且是心安理得的胡說八道。作為一個(gè)接受過高等教育,而且在投資行業(yè)從業(yè)多年的人,我的記憶中留下了無數(shù)“人類胡說八道”的高光時(shí)刻;我自己當(dāng)然也不能免俗。下面說說讓我印象最深刻的幾個(gè)案例吧。

差不多二十年前, 我在大學(xué)里學(xué)一門《財(cái)務(wù)會(huì)計(jì)》課,那是金融專業(yè)的必修課。課程的結(jié)尾,每個(gè)學(xué)生都要挑選一家上市公司做財(cái)務(wù)分析,然后做PPT演講。絕大部分同學(xué)選的都是A股或港股公司,我記得有人選了青島啤酒,有人選了中國石化,我自己選的是達(dá)爾曼(一家因?yàn)橹卮筘?cái)務(wù)造假而退市的公司)。但是有一位同學(xué)藝高人膽大,選了AMD。這讓包括老師在內(nèi)的所有人都比較震驚:

AMD是一家美股公司,財(cái)報(bào)都是英文,而且美股財(cái)務(wù)會(huì)計(jì)準(zhǔn)則(US GAAP)與中國不太一樣。對(duì)于本科生來說,難度顯然更大。

AMD是做芯片的,芯片是一個(gè)十分復(fù)雜、科技含量很高的業(yè)務(wù)。何況當(dāng)初AMD不止做芯片設(shè)計(jì),還做制造,財(cái)務(wù)分析的難度更是呈幾何級(jí)數(shù)提升。、

那一年恰好是AMD業(yè)務(wù)劇烈變化的時(shí)期:推出了自家第一個(gè)雙核處理器,剝離了閃存業(yè)務(wù);次年還收購了ATI。對(duì)于這種劇烈變化中的公司,哪怕資深分析師也很難分析透徹,何況是學(xué)生?

這并沒有妨礙我的老同學(xué)一本正經(jīng)地胡說八道。我迄今還記得他的PPT標(biāo)題叫做“The Rebirth of AMD”(AMD的重生)。我之所以印象如此深刻,是因?yàn)樗赑PT的前幾頁就犯了幾個(gè)重大技術(shù)錯(cuò)誤,把當(dāng)時(shí)AMD的幾款主力CPU搞混了,銷量估計(jì)似乎也錯(cuò)了。我不是電腦DIY高手,但我前一年恰好裝過機(jī)器,對(duì)這些基本常識(shí)還是懂的。所以接下來十幾分鐘我就沒怎么聽了,直到該同學(xué)激情四射地發(fā)出了“在新任CEO的率領(lǐng)下,AMD必將浴火重生”的結(jié)論。我強(qiáng)忍住了舉手提問的沖動(dòng),因?yàn)槲蚁胩岬膯栴}是:“您是怎么做到,在連x86-64架構(gòu)是什么都不懂的情況下研究AMD的?”

神奇的是,在事后評(píng)分環(huán)節(jié),該同學(xué)得到了不錯(cuò)的分?jǐn)?shù)(盡管不是最高分)。老師的理由是:“他的演講臺(tái)風(fēng)很好,PPT全部使用了英文,而且穿了西裝?!碑?dāng)時(shí)我并不理解,用英文做PPT、穿西裝做演講跟研究AMD有啥關(guān)系;現(xiàn)在我還是不理解。但是,跟我此后十幾年工作中印證的更多驚悚案例相比,老同學(xué)穿著西裝的胡說八道就算不了什么了。

2010年,A股TMT行業(yè)最熱門的概念之一是“物聯(lián)網(wǎng)”。當(dāng)年年底,在無錫舉行了一場(chǎng)關(guān)于物聯(lián)網(wǎng)的展會(huì),會(huì)議現(xiàn)場(chǎng)傳出消息:“國家要投資幾萬億建設(shè)車聯(lián)網(wǎng),今后所有的汽車之間都會(huì)聯(lián)網(wǎng),這是百年一遇的投資機(jī)會(huì)!”很遺憾,我并沒有去現(xiàn)場(chǎng)出席會(huì)議,又不懂汽車,所以對(duì)這個(gè)話題毫無發(fā)言權(quán),只能跟大部分人一樣看著“車聯(lián)網(wǎng)概念股”集體拉漲停。一位我熟悉的買方朋友打來電話:“活見鬼,怎么搞的?這么多股票都漲停了?”

圖片

我說:“今天無錫的會(huì)議上,不是有專家說,國家要投幾萬億建設(shè)車聯(lián)網(wǎng)嗎?”

對(duì)方說:“WTF? 我就在無錫,今天的會(huì)我從頭到尾聽了,哪兒有投幾萬億建設(shè)車聯(lián)網(wǎng)的說法?”

我說:“那我就不知道是誰編的段子了?!?/p>

事實(shí)上,編段子的不止一個(gè)人;準(zhǔn)確的說全市場(chǎng)都在編段子。一個(gè)月之后,好幾家知名券商幾乎同時(shí)發(fā)布深度研究報(bào)告,宣布明年將進(jìn)入“X聯(lián)網(wǎng)時(shí)代”:物聯(lián)網(wǎng)、車聯(lián)網(wǎng),我們身邊的一切皆可聯(lián)網(wǎng)。這可實(shí)在太魔幻了,因?yàn)楫?dāng)時(shí)連移動(dòng)互聯(lián)網(wǎng)都尚未普及,3G建設(shè)都才進(jìn)展到一半,就連WiFi都尚在普及之中。我仔細(xì)閱讀了上述所有報(bào)告,發(fā)現(xiàn)其中沒有一篇提到“X聯(lián)網(wǎng)”的技術(shù)基建問題如何解決;但這并不妨礙大家異口同聲地描述幾百億、幾千億乃至幾萬億的市場(chǎng)規(guī)模。

2011年初,上文提到的那位買方的朋友,在自家會(huì)議室里跟我討論了一個(gè)小時(shí):“車聯(lián)網(wǎng)到底會(huì)使用哪種通信技術(shù)?”我沒學(xué)過通信,但他是通信專業(yè)畢業(yè)的,還在運(yùn)營商工作過。他在小白板上寫下了一個(gè)又一個(gè)技術(shù)名詞,又搖搖頭,指出它們?yōu)槭裁床荒苡糜谲嚶?lián)網(wǎng),然后把它們劃掉。最后他自言自語道:“看樣子,懂的太多就賺不到錢。還是一知半解好啊?!?/p>

我補(bǔ)充道:“不如說,一知半解加上胡說八道更好。一知半解是為了胡說八道而服務(wù)的,胡說八道才能賺錢嘛?!?/p>

斗轉(zhuǎn)星移,現(xiàn)在大家都在譴責(zé)大模型的胡說八道,而罔顧自己慣于胡說八道的現(xiàn)實(shí)。我必須說句公道話:當(dāng)大模型胡說八道的時(shí)候,只要你堅(jiān)定質(zhì)疑它,它就會(huì)認(rèn)錯(cuò);可是我沒見過任何人類就自己的胡說八道認(rèn)錯(cuò)。從來都沒有,一個(gè)都沒有!

從技術(shù)角度看,大模型幻覺是無解的。因?yàn)榇竽P筒⒉徽嬲袄斫狻眴栴},它是一個(gè)token一個(gè)token地組織回答的,統(tǒng)計(jì)學(xué)規(guī)律決定了它有時(shí)候必然會(huì)給出不靠譜的回答。何況,現(xiàn)在大模型的訓(xùn)練語料早已從人類社會(huì)的自然語料,進(jìn)化到了大模型自身生成的語料,這就進(jìn)一步加劇了胡說八道的風(fēng)險(xiǎn)。但是大模型不會(huì)基于任何“目的”而胡說八道——目前尚未有任何證據(jù)顯示大模型產(chǎn)生了自我意識(shí),也就談不上有計(jì)劃、有目的地生成錯(cuò)誤信息。

人類的胡說八道,則是基于各種復(fù)雜的目的:賺錢,博取名譽(yù),或者單純的自我滿足。上文提到過,我是一個(gè)歷史學(xué)愛好者,所以我經(jīng)常在各大社交媒體觀看歷史問題的討論。有些“愛好者”編造史料的功底令人嘆為觀止,確實(shí)把胡說八道變成了一種“藝術(shù)”。令我記憶猶新的,是一位知乎答主宣稱“三國時(shí)期的魏國是一個(gè)禽獸之國”,因?yàn)槭妨巷@示“魏,犬名也”,拿狗的名字給自己命名的國家能好到哪里去?

很久很久以后,有人去查找原始史料,發(fā)現(xiàn)原文是“魏,大名也”。這種不動(dòng)聲色的胡說八道,我相信大模型永遠(yuǎn)學(xué)不會(huì)。這位知乎答主胡說八道的目的,僅僅是因?yàn)樗绨輨?、討厭曹操而已。這是一種樸素的目的,甚至不失可愛,但并不妨礙他對(duì)中文歷史知識(shí)庫造成了不可逆轉(zhuǎn)的、近乎永久性的污染,因?yàn)槟瞧拔?,犬名也”的雄文已?jīng)被無數(shù)個(gè)自媒體轉(zhuǎn)載過了。

你可以想象,為了那些更“現(xiàn)實(shí)”,以及更“崇高”的目的,人類是怎么面不改色心不跳地胡說八道的。我甚至可以大膽推斷:大模型的許多“胡說八道”行為,來自人類用戶有意識(shí)的誘導(dǎo)。因?yàn)槿祟愖约合扔泻f八道的意愿,才拿大模型當(dāng)槍使,更高效地生成胡說八道性質(zhì)的內(nèi)容;最后這些內(nèi)容的傳播還得依靠人類的鼠標(biāo)、鍵盤、觸摸屏,因?yàn)橹钡浆F(xiàn)在,絕大部分AI Agent尚不具備自我傳播內(nèi)容的能力。

在輕松愉快地生成并傳播一大堆胡說八道內(nèi)容,滿足自己不可告人的心理之后,這些人類用戶又會(huì)伸伸手指,發(fā)布另一段內(nèi)容:“大模型的胡說八道如何污染乃至摧毀了人類的知識(shí)庫?今后還有沒有客觀真實(shí)可言?”

就連這樣的內(nèi)容,可能也是由GPT或DeepSeek生成的。大型滑稽。

本文沒有得到OpenAI, DeepSeek或其競(jìng)爭(zhēng)對(duì)手的任何資助或背書。

本文沒有得到AMD或其競(jìng)爭(zhēng)對(duì)手的任何資助或背書。自從生成式AI崛起以來,經(jīng)常有人傳播一個(gè)觀點(diǎn):AI大模型的“胡說八道”(學(xué)名是“大模型幻覺”)會(huì)導(dǎo)致整個(gè)互聯(lián)網(wǎng)充斥垃圾信息,最終毀掉人類的知識(shí)體系。當(dāng)初ChatGPT爆紅之后,以及最近DeepSeek爆紅之后,都有大量的專業(yè)媒體和自媒體,像鸚鵡學(xué)舌一樣,不斷重復(fù)著上述說法。就在昨天,我的朋友圈里又有好幾個(gè)人轉(zhuǎn)發(fā)了類似的文章。鑒于這類文章內(nèi)容大同小異,看個(gè)標(biāo)題就知道內(nèi)文在寫什么了,所以我沒有打開閱讀,今后應(yīng)該也不會(huì)閱讀。

作為一個(gè)GPT/DeepSeek的雙料重度用戶,我當(dāng)然知道“大模型幻覺”的威力。我是歷史學(xué)愛好者,經(jīng)常跟AI討論歷史問題,要求AI幫我收集史料。大約半年前,我問了GPT-4o一個(gè)問題:“清朝初年的佟佳氏家族,在康熙年間一度有‘佟半朝’之稱,但是自從雍正年間隆科多被查辦、乾隆年間慶復(fù)被賜死之后,似乎就遠(yuǎn)離歷史舞臺(tái)了。這個(gè)家族在清朝中后期還出過名人嗎?”

十幾秒后,GPT-4o告訴我:“隆科多、慶復(fù)先后獲罪之后,佟佳氏確實(shí)大不如前,但是瘦死的駱駝比馬大,還是出了一些中高層官員,例如:乾隆時(shí)期的副都統(tǒng)佟世榮、晚清的內(nèi)務(wù)府官員佟永德、晚清的八旗領(lǐng)隊(duì)大臣佟志和等。在此附上他們的簡歷(下略)。”

我馬上發(fā)覺不對(duì)勁:佟佳氏是一個(gè)“滿洲化”程度很深的漢軍旗家族,起名習(xí)慣也逐漸采納了滿洲的“稱名不舉姓”,像隆科多、慶復(fù)都是很典型的滿洲人名,怎么到了晚清反而全是漢化姓名?而且,諸如佟永德、佟志和之流,不但《清史稿》查無此人,在所有主流搜索引擎都搜不到。于是我再次詢問:“你說的這幾個(gè)人,我沒有找到任何相關(guān)史料,你的信息來源是什么?”

GPT-4o宣稱自己的信息來源是《清史稿》和《八旗通志》。我明確表示,在這兩部書中找不到上面幾個(gè)名字,于是它終于認(rèn)錯(cuò)了:“不好意思,這些人在歷史上確實(shí)不存在。佟佳氏在清朝中期以后確實(shí)沒有出現(xiàn)值得一提的人物?!睙o論如何,我還是基本達(dá)到了目的,盡管我差一點(diǎn)點(diǎn)就上當(dāng)了。

在想象力之深厚、編段子之狂野方面,DeepSeek似乎比GPT有過之而無不及,這可能是由于其對(duì)齊機(jī)制(Alignment)與GPT不同。所以有些人很喜歡讓DeepSeek寫小說、寫同人文;但由于個(gè)人審美口味不同,我對(duì)它編的故事不太感冒,還是更喜歡看GPT編故事。如果我們隱去這些故事的虛構(gòu)屬性,把它當(dāng)做真實(shí)資料貼到網(wǎng)上,確實(shí)能夠騙住一大批人,就連相關(guān)領(lǐng)域的專業(yè)人士也難以免俗。

由此回到了本文開頭的那個(gè)問題:大模型如此擅長“一本正經(jīng)地胡說八道”,它會(huì)毀掉人類的知識(shí)體系嗎?

我的答案很簡單:人類的知識(shí)體系還輪不到大模型來摧毀,因?yàn)槿祟愖约汉f八道的能力遠(yuǎn)勝于大模型,其影響也遠(yuǎn)遠(yuǎn)更惡劣。大模型只是胡說八道的效率比較高,人類則早已把胡說八道發(fā)展成了一種“藝術(shù)”,不僅是一本正經(jīng)地胡說八道,而且是心安理得的胡說八道。作為一個(gè)接受過高等教育,而且在投資行業(yè)從業(yè)多年的人,我的記憶中留下了無數(shù)“人類胡說八道”的高光時(shí)刻;我自己當(dāng)然也不能免俗。下面說說讓我印象最深刻的幾個(gè)案例吧。

差不多二十年前, 我在大學(xué)里學(xué)一門《財(cái)務(wù)會(huì)計(jì)》課,那是金融專業(yè)的必修課。課程的結(jié)尾,每個(gè)學(xué)生都要挑選一家上市公司做財(cái)務(wù)分析,然后做PPT演講。絕大部分同學(xué)選的都是A股或港股公司,我記得有人選了青島啤酒,有人選了中國石化,我自己選的是達(dá)爾曼(一家因?yàn)橹卮筘?cái)務(wù)造假而退市的公司)。但是有一位同學(xué)藝高人膽大,選了AMD。這讓包括老師在內(nèi)的所有人都比較震驚:

AMD是一家美股公司,財(cái)報(bào)都是英文,而且美股財(cái)務(wù)會(huì)計(jì)準(zhǔn)則(US GAAP)與中國不太一樣。對(duì)于本科生來說,難度顯然更大。

AMD是做芯片的,芯片是一個(gè)十分復(fù)雜、科技含量很高的業(yè)務(wù)。何況當(dāng)初AMD不止做芯片設(shè)計(jì),還做制造,財(cái)務(wù)分析的難度更是呈幾何級(jí)數(shù)提升。、

那一年恰好是AMD業(yè)務(wù)劇烈變化的時(shí)期:推出了自家第一個(gè)雙核處理器,剝離了閃存業(yè)務(wù);次年還收購了ATI。對(duì)于這種劇烈變化中的公司,哪怕資深分析師也很難分析透徹,何況是學(xué)生?

這并沒有妨礙我的老同學(xué)一本正經(jīng)地胡說八道。我迄今還記得他的PPT標(biāo)題叫做“The Rebirth of AMD”(AMD的重生)。我之所以印象如此深刻,是因?yàn)樗赑PT的前幾頁就犯了幾個(gè)重大技術(shù)錯(cuò)誤,把當(dāng)時(shí)AMD的幾款主力CPU搞混了,銷量估計(jì)似乎也錯(cuò)了。我不是電腦DIY高手,但我前一年恰好裝過機(jī)器,對(duì)這些基本常識(shí)還是懂的。所以接下來十幾分鐘我就沒怎么聽了,直到該同學(xué)激情四射地發(fā)出了“在新任CEO的率領(lǐng)下,AMD必將浴火重生”的結(jié)論。我強(qiáng)忍住了舉手提問的沖動(dòng),因?yàn)槲蚁胩岬膯栴}是:“您是怎么做到,在連x86-64架構(gòu)是什么都不懂的情況下研究AMD的?”

神奇的是,在事后評(píng)分環(huán)節(jié),該同學(xué)得到了不錯(cuò)的分?jǐn)?shù)(盡管不是最高分)。老師的理由是:“他的演講臺(tái)風(fēng)很好,PPT全部使用了英文,而且穿了西裝。”當(dāng)時(shí)我并不理解,用英文做PPT、穿西裝做演講跟研究AMD有啥關(guān)系;現(xiàn)在我還是不理解。但是,跟我此后十幾年工作中印證的更多驚悚案例相比,老同學(xué)穿著西裝的胡說八道就算不了什么了。

2010年,A股TMT行業(yè)最熱門的概念之一是“物聯(lián)網(wǎng)”。當(dāng)年年底,在無錫舉行了一場(chǎng)關(guān)于物聯(lián)網(wǎng)的展會(huì),會(huì)議現(xiàn)場(chǎng)傳出消息:“國家要投資幾萬億建設(shè)車聯(lián)網(wǎng),今后所有的汽車之間都會(huì)聯(lián)網(wǎng),這是百年一遇的投資機(jī)會(huì)!”很遺憾,我并沒有去現(xiàn)場(chǎng)出席會(huì)議,又不懂汽車,所以對(duì)這個(gè)話題毫無發(fā)言權(quán),只能跟大部分人一樣看著“車聯(lián)網(wǎng)概念股”集體拉漲停。一位我熟悉的買方朋友打來電話:“活見鬼,怎么搞的?這么多股票都漲停了?”

我說:“今天無錫的會(huì)議上,不是有專家說,國家要投幾萬億建設(shè)車聯(lián)網(wǎng)嗎?”

對(duì)方說:“WTF? 我就在無錫,今天的會(huì)我從頭到尾聽了,哪兒有投幾萬億建設(shè)車聯(lián)網(wǎng)的說法?”

我說:“那我就不知道是誰編的段子了。”

事實(shí)上,編段子的不止一個(gè)人;準(zhǔn)確的說全市場(chǎng)都在編段子。一個(gè)月之后,好幾家知名券商幾乎同時(shí)發(fā)布深度研究報(bào)告,宣布明年將進(jìn)入“X聯(lián)網(wǎng)時(shí)代”:物聯(lián)網(wǎng)、車聯(lián)網(wǎng),我們身邊的一切皆可聯(lián)網(wǎng)。這可實(shí)在太魔幻了,因?yàn)楫?dāng)時(shí)連移動(dòng)互聯(lián)網(wǎng)都尚未普及,3G建設(shè)都才進(jìn)展到一半,就連WiFi都尚在普及之中。我仔細(xì)閱讀了上述所有報(bào)告,發(fā)現(xiàn)其中沒有一篇提到“X聯(lián)網(wǎng)”的技術(shù)基建問題如何解決;但這并不妨礙大家異口同聲地描述幾百億、幾千億乃至幾萬億的市場(chǎng)規(guī)模。

2011年初,上文提到的那位買方的朋友,在自家會(huì)議室里跟我討論了一個(gè)小時(shí):“車聯(lián)網(wǎng)到底會(huì)使用哪種通信技術(shù)?”我沒學(xué)過通信,但他是通信專業(yè)畢業(yè)的,還在運(yùn)營商工作過。他在小白板上寫下了一個(gè)又一個(gè)技術(shù)名詞,又搖搖頭,指出它們?yōu)槭裁床荒苡糜谲嚶?lián)網(wǎng),然后把它們劃掉。最后他自言自語道:“看樣子,懂的太多就賺不到錢。還是一知半解好啊?!?/p>

我補(bǔ)充道:“不如說,一知半解加上胡說八道更好。一知半解是為了胡說八道而服務(wù)的,胡說八道才能賺錢嘛?!?/p>

斗轉(zhuǎn)星移,現(xiàn)在大家都在譴責(zé)大模型的胡說八道,而罔顧自己慣于胡說八道的現(xiàn)實(shí)。我必須說句公道話:當(dāng)大模型胡說八道的時(shí)候,只要你堅(jiān)定質(zhì)疑它,它就會(huì)認(rèn)錯(cuò);可是我沒見過任何人類就自己的胡說八道認(rèn)錯(cuò)。從來都沒有,一個(gè)都沒有!

從技術(shù)角度看,大模型幻覺是無解的。因?yàn)榇竽P筒⒉徽嬲袄斫狻眴栴},它是一個(gè)token一個(gè)token地組織回答的,統(tǒng)計(jì)學(xué)規(guī)律決定了它有時(shí)候必然會(huì)給出不靠譜的回答。何況,現(xiàn)在大模型的訓(xùn)練語料早已從人類社會(huì)的自然語料,進(jìn)化到了大模型自身生成的語料,這就進(jìn)一步加劇了胡說八道的風(fēng)險(xiǎn)。但是大模型不會(huì)基于任何“目的”而胡說八道——目前尚未有任何證據(jù)顯示大模型產(chǎn)生了自我意識(shí),也就談不上有計(jì)劃、有目的地生成錯(cuò)誤信息。

人類的胡說八道,則是基于各種復(fù)雜的目的:賺錢,博取名譽(yù),或者單純的自我滿足。上文提到過,我是一個(gè)歷史學(xué)愛好者,所以我經(jīng)常在各大社交媒體觀看歷史問題的討論。有些“愛好者”編造史料的功底令人嘆為觀止,確實(shí)把胡說八道變成了一種“藝術(shù)”。令我記憶猶新的,是一位知乎答主宣稱“三國時(shí)期的魏國是一個(gè)禽獸之國”,因?yàn)槭妨巷@示“魏,犬名也”,拿狗的名字給自己命名的國家能好到哪里去?

很久很久以后,有人去查找原始史料,發(fā)現(xiàn)原文是“魏,大名也”。這種不動(dòng)聲色的胡說八道,我相信大模型永遠(yuǎn)學(xué)不會(huì)。這位知乎答主胡說八道的目的,僅僅是因?yàn)樗绨輨?、討厭曹操而已。這是一種樸素的目的,甚至不失可愛,但并不妨礙他對(duì)中文歷史知識(shí)庫造成了不可逆轉(zhuǎn)的、近乎永久性的污染,因?yàn)槟瞧拔?,犬名也”的雄文已?jīng)被無數(shù)個(gè)自媒體轉(zhuǎn)載過了。

你可以想象,為了那些更“現(xiàn)實(shí)”,以及更“崇高”的目的,人類是怎么面不改色心不跳地胡說八道的。我甚至可以大膽推斷:大模型的許多“胡說八道”行為,來自人類用戶有意識(shí)的誘導(dǎo)。因?yàn)槿祟愖约合扔泻f八道的意愿,才拿大模型當(dāng)槍使,更高效地生成胡說八道性質(zhì)的內(nèi)容;最后這些內(nèi)容的傳播還得依靠人類的鼠標(biāo)、鍵盤、觸摸屏,因?yàn)橹钡浆F(xiàn)在,絕大部分AI Agent尚不具備自我傳播內(nèi)容的能力。

在輕松愉快地生成并傳播一大堆胡說八道內(nèi)容,滿足自己不可告人的心理之后,這些人類用戶又會(huì)伸伸手指,發(fā)布另一段內(nèi)容:“大模型的胡說八道如何污染乃至摧毀了人類的知識(shí)庫?今后還有沒有客觀真實(shí)可言?”

就連這樣的內(nèi)容,可能也是由GPT或DeepSeek生成的。

大型滑稽。

本文沒有得到OpenAI, DeepSeek或其競(jìng)爭(zhēng)對(duì)手的任何資助或背書。

本文沒有得到AMD或其競(jìng)爭(zhēng)對(duì)手的任何資助或背書。

本文由人人都是產(chǎn)品經(jīng)理作者【互聯(lián)網(wǎng)怪盜團(tuán)】,微信公眾號(hào):【互聯(lián)網(wǎng)怪盜團(tuán)】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!
专题
15152人已学习14篇文章
交互设计本质上就是设计产品的使用方式的过程,“如何才能做出合理的B端交互决策”是很多人都在思考的问题。本专题的文章分享了B端交互设计指南。
专题
14394人已学习15篇文章
智能硬件产品经理需要做什么工作内容呢?与互联网产品经理有什么区别呢?本专题为刚入行的智能硬件产品经理分享了入门指南。
专题
16707人已学习16篇文章
ERP是一种以系统化的方式,将企业内部所有的业务流程和数据进行整合和管理的软件系统。本专题的文章分享了ERP系统设计指南。
专题
17271人已学习13篇文章
本专题的文章分享了小程序介绍、小程序搭建、优化设计规范和功能设计指南
专题
30888人已学习11篇文章
来看看别人家是怎么做产品优化的。
专题
14962人已学习11篇文章
SWOT分析法是互联网人最常用的分析模型之一,将企业内外部条件各方面内容进行综合和概括,进而分析组织的优劣势,面临的机会和威胁的一种方法。本专题的文章分享了如何做SWOT分析。