國(guó)內(nèi)大語(yǔ)言模型產(chǎn)品的7個(gè)問題-六小龍or六條蟲?
在AI領(lǐng)域,被譽(yù)為“六小龍”的六家初創(chuàng)公司正面臨著多重挑戰(zhàn)。從尋找新的創(chuàng)新源泉,到解決內(nèi)容幻覺、知識(shí)融合難題,再到價(jià)值觀的重塑和產(chǎn)品方向的探索,這些公司正處于一個(gè)充滿機(jī)遇與挑戰(zhàn)的階段。本文將深入探討這些問題,并展望AI技術(shù)的未來發(fā)展趨勢(shì),希望能為讀者提供一些有價(jià)值的思考和啟示。
目前零一萬(wàn)物、百川智能、智譜AI、月之暗面、Minimax和階躍星辰被稱為X小龍。
另外在國(guó)內(nèi)大模型公司中,一直有著“X小龍”的說法,有說四小龍的,也有說六小龍的,還有說六小虎的。
目前的AI六小龍主要指的是在AI領(lǐng)域表現(xiàn)突出的六家初創(chuàng)公司,包括零一萬(wàn)物、MiniMax、百川智能、智譜AI、階躍星辰、月之暗面
問題一 迷茫:無師可偷
之前2022年年底從GPT-3.5開始,大家開始是篩選掉第一批調(diào)用GPTAPI接口封裝為自家模型并號(hào)稱大模型的公司。
到GPT-4開始篩選掉一批基于LLAMA等開源模型做調(diào)優(yōu)的并號(hào)稱大模型的公司。
到GPT-4o發(fā)布至今半年多過去了,偷感十足的大模型公司在等著GPT-5的發(fā)布,GPT-5產(chǎn)品遲遲不再發(fā)布,導(dǎo)致無師可偷。
六小虎也好,六小龍也好至少是有部署過預(yù)訓(xùn)練的,可能內(nèi)核必然借鑒了Transformer的架構(gòu)和數(shù)據(jù)輸入和生成方式,但是六小龍是國(guó)內(nèi)除了BAT之外不僅做了調(diào)優(yōu)API調(diào)用,還是做了預(yù)訓(xùn)練的,預(yù)訓(xùn)練的成本大家都懂:巨貴。
問題二 錯(cuò)位:內(nèi)容幻覺
六小龍大模型雖然在寫作、推理、規(guī)劃、數(shù)學(xué)、代碼等諸多領(lǐng)域都展現(xiàn)出了強(qiáng)大甚至比肩人類的能力,卻經(jīng)常出現(xiàn)內(nèi)容幻覺、價(jià)值觀錯(cuò)位、歧視偏見等問題。
我懷疑或者說可以肯定六小龍的大模型產(chǎn)品沒有研究過大模型內(nèi)部語(yǔ)言和知識(shí)機(jī)理。對(duì)他們來說大模型仍然是一個(gè)黑箱。
一評(píng)測(cè)的時(shí)候貌似得分都很高,其實(shí)評(píng)測(cè)數(shù)據(jù)是從外部行為評(píng)估大模型的能力,容易受到數(shù)據(jù)選擇、指標(biāo)設(shè)計(jì)、提示方案等因素的影響。
對(duì)六小龍的產(chǎn)品團(tuán)隊(duì)來說大規(guī)模參數(shù)化表征以及核心過程(如預(yù)訓(xùn)練、指令微調(diào)、人 類反饋強(qiáng)化學(xué)習(xí))的復(fù)雜動(dòng)態(tài)特性仍然是個(gè)謎。
問題三: 復(fù)雜:知識(shí)融合
大模型難以理解復(fù)雜的知識(shí)結(jié)構(gòu),如實(shí)體、關(guān)系、事件和概念以及其間的復(fù)雜關(guān)系;同樣的知識(shí)可以通過不同語(yǔ)言形式表達(dá),大模型也難以處理。在知識(shí)不完整性方 面,大模型要能夠利用外部資源,并與內(nèi)部參數(shù)化知識(shí)進(jìn)行整合。
這就需要對(duì)大模型獲取外部資源、 利用自身大模型中知識(shí)以及處理語(yǔ)言模型內(nèi)知識(shí)與外部知識(shí)沖突能力進(jìn)行系統(tǒng)評(píng)測(cè)。目前評(píng)測(cè)表明, 大模型在外部知識(shí)獲取、利用和內(nèi)外部沖突知識(shí)處理方面存在挑戰(zhàn)。
大模型在知識(shí)數(shù)據(jù)存儲(chǔ)、調(diào)用、融合,在知識(shí)結(jié)構(gòu)的多源性、知識(shí)對(duì)齊上有太多的時(shí)間需要產(chǎn)品補(bǔ)充上。
問題四:三觀:價(jià)值重塑
大語(yǔ)言模型不是傳統(tǒng)的搜索引擎,以前的搜索引擎是根據(jù)提問,搜索出來一系列經(jīng)過排序的網(wǎng)頁(yè),不會(huì)想大模型給予直接的結(jié)果,在大模型時(shí)候,假如不加思索的采用生成的內(nèi)容,很可能出現(xiàn)三觀不正確的問題。
問題五:涌現(xiàn):遠(yuǎn)離AGI
用戶從一開始對(duì)大模型的期待是AGI,產(chǎn)生智能涌現(xiàn)。可以完成過去需要不同專用小模型才能完成的多種任務(wù),呈現(xiàn)出與人類通用智能相似的功能。
目前六小龍普遍沒有這類產(chǎn)品出現(xiàn)過。
國(guó)際上有些團(tuán)隊(duì)在這一領(lǐng)域探索稍微提前一些,例如, 斯坦福大學(xué)團(tuán)隊(duì) 2023 年 4 月推出一個(gè)虛擬小鎮(zhèn),構(gòu)建了 25 個(gè)大模型驅(qū)動(dòng)的智能體,擁有不同個(gè)性的智能體,在小鎮(zhèn)中自由生活、工作和社交; 從而研發(fā)出大模型的自然語(yǔ)言交互能力使之發(fā)生在機(jī)器和機(jī)器之間,作為信息交流的工具和重要載體。
問題六:分裂:理強(qiáng)文弱
目前六小龍的團(tuán)隊(duì)核心以算法工程技術(shù)人員為主,不懂計(jì)算機(jī)技術(shù)的人在團(tuán)隊(duì)比較難混,例如:不懂K8S在基礎(chǔ)數(shù)據(jù)輸入層可能就難以作為主程核心,不懂Transformer架構(gòu),層,在模型架構(gòu)階段可能會(huì)被避之門外。
實(shí)際上對(duì)用戶來說用戶輸入中文生成的圖就是沒有輸入英文來的準(zhǔn)確,請(qǐng)問六小龍你們?yōu)樯叮?/p>
其中有一個(gè)非常重要的原因我分析是:中文語(yǔ)料數(shù)據(jù)集比較少,導(dǎo)致大模型訓(xùn)練樣本質(zhì)量不夠高、規(guī)模不夠大 。
構(gòu)建更高質(zhì)量,更大規(guī)模的中文語(yǔ)言資源庫(kù),需要發(fā)揮文科特別是語(yǔ)言學(xué)科的優(yōu)勢(shì)。
問題七:產(chǎn)品:不動(dòng)腦子
先看一下六小龍的產(chǎn)品如下圖:
1、萬(wàn)知,零一萬(wàn)物
假如不說是零一萬(wàn)物的產(chǎn)品,可能很多朋友不知道有這個(gè)大模型產(chǎn)品。假如零一萬(wàn)物不是李開復(fù)老師的大模型,可能會(huì)被罵的很差。打開萬(wàn)知網(wǎng)站,我也不知道為何要用萬(wàn)只?萬(wàn)只的產(chǎn)品能否告訴我這個(gè)產(chǎn)品有什么特長(zhǎng)和差異化?
2、百小應(yīng),百川智能
百小應(yīng)選的賽道是熱門賽道,搜索,但是這個(gè)產(chǎn)品得等百川智能突破以上7個(gè)問題,才能是一個(gè)好的產(chǎn)品。
目前的百小應(yīng),應(yīng)用主要問題解決傳統(tǒng)搜索問題還沒解決,產(chǎn)品去引導(dǎo)要下載APP了,有點(diǎn)急了。
3、智譜AI,智譜清言
智譜清言看著框架結(jié)構(gòu)跟ChatGPT產(chǎn)品像。當(dāng)你用了以后,你會(huì)認(rèn)可日久見模心,該用誰(shuí),誰(shuí)好用自見分享,建議大家比較一下,大家愿意比較即是壓力也應(yīng)該是產(chǎn)品團(tuán)隊(duì)的動(dòng)力。
4、kimi 月之暗面
這款產(chǎn)品自從營(yíng)銷之后模型就貌似停止進(jìn)步了,在其宣傳超長(zhǎng)上下文,創(chuàng)始人是否套現(xiàn)風(fēng)波之前,我每次阿里巴巴邀請(qǐng)給淘寶教育講課的時(shí)候,我會(huì)介紹一下這款產(chǎn)品,當(dāng)時(shí)ChatGPT讀數(shù)據(jù)一是不合規(guī),二是調(diào)用也很貴,所以用Kimi幫助閱讀PDF提煉摘要還挺方便的,請(qǐng)問kimi產(chǎn)品這一年了kimi產(chǎn)品又有哪些進(jìn)步?
5、MiniMax
MiniMax海螺的產(chǎn)品團(tuán)隊(duì)可能末尾淘汰制,目前能看到海螺的產(chǎn)品團(tuán)隊(duì)求生欲比較強(qiáng),再積極的迭代。
產(chǎn)品整合了音樂生成、視頻生成、文生文、再突破需要產(chǎn)品有創(chuàng)新的應(yīng)用了。
6、躍問:階躍星辰
這款產(chǎn)品寫文章的時(shí)候第一次用,先不點(diǎn)評(píng),大家自行比較
從PC互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)再到AIGC,我做過的產(chǎn)品不下數(shù)十款,正是對(duì)這些產(chǎn)品的全情投入,形成了產(chǎn)品感,就像現(xiàn)在流行的偷感,很刺激當(dāng)你形成產(chǎn)品感,你大概率能夠感知一款產(chǎn)品的未來會(huì)如何。
早些年P(guān)C時(shí)代你能夠通過一款產(chǎn)品得前端就能看到這家公司的組織結(jié)構(gòu),例如2019年你看天貓,上面的母嬰模塊,女裝模塊,箱包模塊,其實(shí)其產(chǎn)品就是對(duì)應(yīng)其組織團(tuán)隊(duì)的劃分的,組織團(tuán)隊(duì)進(jìn)而也決定其產(chǎn)品得價(jià)值。
后面到移動(dòng)互聯(lián)網(wǎng),字節(jié)跳動(dòng)、美團(tuán)、大家能夠看到前者給用戶提供了完美的上癮模型,后者給用戶解決點(diǎn)外賣的痛點(diǎn)。
到移動(dòng)互聯(lián)網(wǎng)至少產(chǎn)品經(jīng)理還在干人事,還在思考用戶需求,用戶的痛點(diǎn)是什么,如何設(shè)計(jì)產(chǎn)品去解決這些痛點(diǎn)。
可能AIGC前半程產(chǎn)品經(jīng)理忘記了這些,也可能本來還不夠?qū)I(yè),相信下半場(chǎng)AIGC無論是大模型基礎(chǔ)模型產(chǎn)品還是業(yè)務(wù)應(yīng)用型大模型產(chǎn)品,將會(huì)快速的回歸用戶、回歸客戶的本質(zhì)。
本文不是將六小龍說成六跳蟲,意在一起去找到AIGC的產(chǎn)品價(jià)值、用戶價(jià)值、市場(chǎng)客戶價(jià)值。
專欄作家
連詩(shī)路AI產(chǎn)品,公眾號(hào):連詩(shī)路AI產(chǎn)品。人人都是產(chǎn)品經(jīng)理專欄作家,《產(chǎn)品進(jìn)化論:AI+時(shí)代產(chǎn)品經(jīng)理的思維方法》一書作者,前阿里產(chǎn)品專家,希望與創(chuàng)業(yè)者多多交流。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
不得不說AI極大可能就是下一個(gè)風(fēng)口,盡管只是起步就已經(jīng)展現(xiàn)了其強(qiáng)大的能力。