淺談國產(chǎn)大模型的過去、現(xiàn)在以及未來

0 評論 312 瀏覽 0 收藏 10 分鐘

國產(chǎn)大模型技術(shù)自ChatGPT爆火之后迅速發(fā)展,但隨著時間的推移,熱潮逐漸降溫。本文將探討國產(chǎn)大模型從誕生至今的演進歷程,分析當(dāng)前市場狀況及其面臨的挑戰(zhàn),并展望未來的發(fā)展方向。文章通過深入分析,揭示了大模型技術(shù)在商業(yè)化和差異化方面的局限,同時指出了技術(shù)發(fā)展與市場需求之間的差距。

怎樣去衡量一款A(yù)I產(chǎn)品是否成功?

這個問題如果放在兩年前,很多人給出的答案會集中在AI的狹義領(lǐng)域,AlphaGo、Siri、Google Assistant,或是用于解鎖手機的圖像識別技術(shù),能夠在某個特定的領(lǐng)域完成特定的任務(wù)。

但從2023年開始,也就是ChatGPT火了之后,人們對AI的看法發(fā)生了一些轉(zhuǎn)變,學(xué)習(xí)、適應(yīng)、推理的自主決策的能力,不免讓人產(chǎn)生AGI會成為現(xiàn)實的錯覺。

所以我們能看到,在ChatGPT發(fā)布后的不到兩年里,國內(nèi)就上線了數(shù)百個大模型,里面既有互聯(lián)網(wǎng)大公司,也有各種垂類公司,還有一批跑在風(fēng)口上的初創(chuàng)企業(yè)。

毫無疑問,AI大模型的研發(fā)需要投入大量的資金和人才,這也導(dǎo)致了絕大部分初創(chuàng)公司的估值被嚴重透支,他們在短期內(nèi)獲得了大量融資,后續(xù)卻無法持續(xù)燒錢維持迭代和商業(yè)落地,隨著投資人信心下降,不免有一些機構(gòu)選擇清倉或撤資。

大浪淘沙,伴隨無休止的套殼和再生的游戲,當(dāng)下市面上能夠接觸到的模型主要分為兩類。一是基礎(chǔ)通用大模型,比如文心一言、通義千問、元寶這類大廠產(chǎn)品,它們應(yīng)用場景廣泛,功能包括但不限于文本生成、語言理解、問答系統(tǒng)、摘要提取、機器翻譯等。某種程度上,它們可以作為下游任務(wù)的基礎(chǔ)模型,通過微調(diào)或遷移學(xué)習(xí),適應(yīng)不同的應(yīng)用場景和需求。

其次是行業(yè)專用,各類細分賽道的產(chǎn)出,像金山的政務(wù)大模型,多家公司的醫(yī)療、金融等大模型,應(yīng)用場景主要集中在各自的專業(yè)領(lǐng)域內(nèi)。例如,醫(yī)療大模型可以應(yīng)用于電子病歷分析、疾病預(yù)測、藥物研發(fā)等多個環(huán)節(jié);金融大模型則可以應(yīng)用于風(fēng)險評估、投資策略制定、客戶畫像構(gòu)建等多個方面。

如果僅從數(shù)字上看,國產(chǎn)大模型在技術(shù)上的確成長很快,根據(jù)SuperCLUE的評測結(jié)果,國內(nèi)絕大部分閉源模型已超過GPT-3.5Turbo。但事實上,這樣的比較意義并不大,大模型雖然多,技術(shù)代差也在縮小,但商業(yè)化、差異化但效果并不明顯,以至于大多數(shù)投資人回歸到觀望的態(tài)度。

前段時間圈子里比較熱的幾個話題,Kimi母公司月之暗面在2C業(yè)務(wù)之外,官宣了Kimi企業(yè)級API的正式發(fā)布,比通用模型有更高等級的數(shù)據(jù)安全保障和并發(fā)速率;智譜AI發(fā)布“Z計劃”,開始、轉(zhuǎn)型投資人的身份。

縱觀五虎里剩下的百川智能、零一萬物、MiniMax三家公司,推出的產(chǎn)品也很難打出真正的差異化,C端主要提升聽說讀寫技能,產(chǎn)業(yè)端則作為私有數(shù)據(jù)平臺和簡化復(fù)雜需求的工具。一股勁兒地都在鉆技術(shù),較量百萬,頂多千萬級的日活,但市場一直缺乏能夠承載AI的殺手級應(yīng)用。

這樣一來,逐漸聚焦于一個關(guān)鍵議題:盡管我們不斷追求更大的數(shù)據(jù)量、更強的計算能力以及更復(fù)雜的模型訓(xùn)練,以期構(gòu)建出更加智能的大模型,但這一過程中往往忽視了一個至關(guān)重要的前提:這些高級模型的有效運用與推進,離不開專業(yè)人員的深度參與和專業(yè)方法的精準(zhǔn)實施。

當(dāng)我們試圖將這些大模型直接應(yīng)用于具體場景,如新聞資訊平臺或金融領(lǐng)域時,面臨的挑戰(zhàn)便顯現(xiàn)出來。比如在面對如抖音、快手等已高度優(yōu)化用戶畫像的平臺時,大模型似乎并未能帶來顯著的變革性影響。這并非因為大模型本身不具備潛力,而是其在實際應(yīng)用中的定制化與精準(zhǔn)化需求遠未被充分滿足。

進一步來講,如果將大模型應(yīng)用于傳統(tǒng)制造業(yè)或低門檻工作領(lǐng)域,同樣面臨嚴峻挑戰(zhàn)。

過去人們以為,通過大模型的指導(dǎo),即便是非專業(yè)人士也能輕松勝任高技能要求的崗位。然而,現(xiàn)實卻遠非如此。社會的工作分工與評價體系依然根深蒂固,強調(diào)經(jīng)驗積累與行業(yè)專業(yè)性。這意味著,僅憑大模型的短期培訓(xùn),很難讓一個普通人迅速跨越行業(yè)門檻,達到專業(yè)水準(zhǔn)。

一個無法忽視的問題是,不同企業(yè)、不同業(yè)務(wù)應(yīng)當(dāng)如何設(shè)定合理且科學(xué)的增長標(biāo)準(zhǔn),以及在缺乏直接參照對象時,如何衡量并規(guī)劃業(yè)務(wù)的未來增長。

在觀察當(dāng)前市場上的AI大模型產(chǎn)品時,起初,這些技術(shù)可能憑借其新穎性和創(chuàng)新性吸引了大量關(guān)注,但隨著技術(shù)的成熟和市場的飽和,增長動力逐漸減弱。

事實上,許多高估值的產(chǎn)品往往是在某個小眾領(lǐng)域進行了深度挖掘和創(chuàng)新。這些問題極具普遍性,橫跨了不同企業(yè)和業(yè)務(wù)領(lǐng)域,例如,拼多多通過重塑電商體驗,為消費者帶來了全新的購物感受;京東則憑借其強大的物流體系,構(gòu)建了難以復(fù)制的供應(yīng)鏈壁壘。

對于當(dāng)前的大模型技術(shù)而言,發(fā)展方向應(yīng)當(dāng)更加注重用戶體驗和市場需求的結(jié)合。當(dāng)這些技術(shù)被嵌入到如WPS這樣的辦公軟件,或是美團這樣的服務(wù)平臺中時,核心問題在于,如何讓AI技術(shù)更好地服務(wù)于用戶需求,而不是僅僅停留在表面或淺層次的分析上。

舉個例子,用戶讓AI軟件猜測自己想吃什么,它們的確會通過語義分析來理解用戶的意圖,并給出一些建議或推薦。然而,這些推薦往往停留在較為寬泛的層面,沒有真正深入到用戶的個性化需求中。

換句話說,因為當(dāng)前的AI技術(shù)還難以完全理解用戶的復(fù)雜情感和具體需求,只能基于已有的數(shù)據(jù)和模型進行大致的預(yù)測和推薦;另一方面,讓AI猜測人的已有目的,這件事本身就很浪費時間和技術(shù)資源。

再以翻譯為例,假設(shè)我們已經(jīng)能夠?qū)⒎g精度提升到99%,而市場上的需求僅需要95.6%的準(zhǔn)確度。這時,再花費大量資源去將精度從99%提升至99.5%,是否真的有意義?尤其是當(dāng)這種提升對于大多數(shù)用戶來說,并無顯著差別時。

這里的核心問題是,從商業(yè)角度來審視技術(shù)的ROI(投資回報率)和ROE(凈資產(chǎn)收益率)。在一個技術(shù)概念成為風(fēng)口時,往往過分強調(diào)技術(shù)的先進性,而忽略了其在實際應(yīng)用中的價值和可持續(xù)性。真正的挑戰(zhàn)在于,如何將技術(shù)轉(zhuǎn)化為實際的生產(chǎn)力,解決用戶的真實需求,而不是簡單地堆砌技術(shù)。

然而,能看到的卻是大量公司在盲目跟風(fēng),試圖通過增加數(shù)據(jù)量、提升算力等手段來打造所謂的“大模型”。但這種做法往往忽略了客戶成功(CSM)的重要性,如何確保技術(shù)能夠真正滿足客戶需求,為客戶創(chuàng)造價值?

更為嚴重的是,許多公司并沒有清晰的業(yè)務(wù)規(guī)劃和階段性目標(biāo),像無頭蒼蠅一樣四處亂撞,結(jié)果往往是資源浪費和失敗。大模型公司應(yīng)該更加聚焦于實際場景的應(yīng)用和落地,而不是僅僅停留在技術(shù)層面的自嗨,這樣的認知應(yīng)該早已共識,只不過問題尚未解決,市場也難有突破性的故事。

作者|鹿堯
本文由人人都是產(chǎn)品經(jīng)理作者【新眸】,微信公眾號:【新眸】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!