淺談國產大模型的過去、現(xiàn)在以及未來

新眸
0 評論 432 瀏覽 0 收藏 10 分鐘
🔗 产品经理的职业发展路径主要有四个方向:专业线、管理线、项目线和自主创业。管理线是指转向管理岗位,带一个团队..

國產大模型技術自ChatGPT爆火之后迅速發(fā)展,但隨著時間的推移,熱潮逐漸降溫。本文將探討國產大模型從誕生至今的演進歷程,分析當前市場狀況及其面臨的挑戰(zhàn),并展望未來的發(fā)展方向。文章通過深入分析,揭示了大模型技術在商業(yè)化和差異化方面的局限,同時指出了技術發(fā)展與市場需求之間的差距。

怎樣去衡量一款AI產品是否成功?

這個問題如果放在兩年前,很多人給出的答案會集中在AI的狹義領域,AlphaGo、Siri、Google Assistant,或是用于解鎖手機的圖像識別技術,能夠在某個特定的領域完成特定的任務。

但從2023年開始,也就是ChatGPT火了之后,人們對AI的看法發(fā)生了一些轉變,學習、適應、推理的自主決策的能力,不免讓人產生AGI會成為現(xiàn)實的錯覺。

所以我們能看到,在ChatGPT發(fā)布后的不到兩年里,國內就上線了數(shù)百個大模型,里面既有互聯(lián)網(wǎng)大公司,也有各種垂類公司,還有一批跑在風口上的初創(chuàng)企業(yè)。

毫無疑問,AI大模型的研發(fā)需要投入大量的資金和人才,這也導致了絕大部分初創(chuàng)公司的估值被嚴重透支,他們在短期內獲得了大量融資,后續(xù)卻無法持續(xù)燒錢維持迭代和商業(yè)落地,隨著投資人信心下降,不免有一些機構選擇清倉或撤資。

大浪淘沙,伴隨無休止的套殼和再生的游戲,當下市面上能夠接觸到的模型主要分為兩類。一是基礎通用大模型,比如文心一言、通義千問、元寶這類大廠產品,它們應用場景廣泛,功能包括但不限于文本生成、語言理解、問答系統(tǒng)、摘要提取、機器翻譯等。某種程度上,它們可以作為下游任務的基礎模型,通過微調或遷移學習,適應不同的應用場景和需求。

其次是行業(yè)專用,各類細分賽道的產出,像金山的政務大模型,多家公司的醫(yī)療、金融等大模型,應用場景主要集中在各自的專業(yè)領域內。例如,醫(yī)療大模型可以應用于電子病歷分析、疾病預測、藥物研發(fā)等多個環(huán)節(jié);金融大模型則可以應用于風險評估、投資策略制定、客戶畫像構建等多個方面。

如果僅從數(shù)字上看,國產大模型在技術上的確成長很快,根據(jù)SuperCLUE的評測結果,國內絕大部分閉源模型已超過GPT-3.5Turbo。但事實上,這樣的比較意義并不大,大模型雖然多,技術代差也在縮小,但商業(yè)化、差異化但效果并不明顯,以至于大多數(shù)投資人回歸到觀望的態(tài)度。

前段時間圈子里比較熱的幾個話題,Kimi母公司月之暗面在2C業(yè)務之外,官宣了Kimi企業(yè)級API的正式發(fā)布,比通用模型有更高等級的數(shù)據(jù)安全保障和并發(fā)速率;智譜AI發(fā)布“Z計劃”,開始、轉型投資人的身份。

縱觀五虎里剩下的百川智能、零一萬物、MiniMax三家公司,推出的產品也很難打出真正的差異化,C端主要提升聽說讀寫技能,產業(yè)端則作為私有數(shù)據(jù)平臺和簡化復雜需求的工具。一股勁兒地都在鉆技術,較量百萬,頂多千萬級的日活,但市場一直缺乏能夠承載AI的殺手級應用。

這樣一來,逐漸聚焦于一個關鍵議題:盡管我們不斷追求更大的數(shù)據(jù)量、更強的計算能力以及更復雜的模型訓練,以期構建出更加智能的大模型,但這一過程中往往忽視了一個至關重要的前提:這些高級模型的有效運用與推進,離不開專業(yè)人員的深度參與和專業(yè)方法的精準實施。

當我們試圖將這些大模型直接應用于具體場景,如新聞資訊平臺或金融領域時,面臨的挑戰(zhàn)便顯現(xiàn)出來。比如在面對如抖音、快手等已高度優(yōu)化用戶畫像的平臺時,大模型似乎并未能帶來顯著的變革性影響。這并非因為大模型本身不具備潛力,而是其在實際應用中的定制化與精準化需求遠未被充分滿足。

進一步來講,如果將大模型應用于傳統(tǒng)制造業(yè)或低門檻工作領域,同樣面臨嚴峻挑戰(zhàn)。

過去人們以為,通過大模型的指導,即便是非專業(yè)人士也能輕松勝任高技能要求的崗位。然而,現(xiàn)實卻遠非如此。社會的工作分工與評價體系依然根深蒂固,強調經驗積累與行業(yè)專業(yè)性。這意味著,僅憑大模型的短期培訓,很難讓一個普通人迅速跨越行業(yè)門檻,達到專業(yè)水準。

一個無法忽視的問題是,不同企業(yè)、不同業(yè)務應當如何設定合理且科學的增長標準,以及在缺乏直接參照對象時,如何衡量并規(guī)劃業(yè)務的未來增長。

在觀察當前市場上的AI大模型產品時,起初,這些技術可能憑借其新穎性和創(chuàng)新性吸引了大量關注,但隨著技術的成熟和市場的飽和,增長動力逐漸減弱。

事實上,許多高估值的產品往往是在某個小眾領域進行了深度挖掘和創(chuàng)新。這些問題極具普遍性,橫跨了不同企業(yè)和業(yè)務領域,例如,拼多多通過重塑電商體驗,為消費者帶來了全新的購物感受;京東則憑借其強大的物流體系,構建了難以復制的供應鏈壁壘。

對于當前的大模型技術而言,發(fā)展方向應當更加注重用戶體驗和市場需求的結合。當這些技術被嵌入到如WPS這樣的辦公軟件,或是美團這樣的服務平臺中時,核心問題在于,如何讓AI技術更好地服務于用戶需求,而不是僅僅停留在表面或淺層次的分析上。

舉個例子,用戶讓AI軟件猜測自己想吃什么,它們的確會通過語義分析來理解用戶的意圖,并給出一些建議或推薦。然而,這些推薦往往停留在較為寬泛的層面,沒有真正深入到用戶的個性化需求中。

換句話說,因為當前的AI技術還難以完全理解用戶的復雜情感和具體需求,只能基于已有的數(shù)據(jù)和模型進行大致的預測和推薦;另一方面,讓AI猜測人的已有目的,這件事本身就很浪費時間和技術資源。

再以翻譯為例,假設我們已經能夠將翻譯精度提升到99%,而市場上的需求僅需要95.6%的準確度。這時,再花費大量資源去將精度從99%提升至99.5%,是否真的有意義?尤其是當這種提升對于大多數(shù)用戶來說,并無顯著差別時。

這里的核心問題是,從商業(yè)角度來審視技術的ROI(投資回報率)和ROE(凈資產收益率)。在一個技術概念成為風口時,往往過分強調技術的先進性,而忽略了其在實際應用中的價值和可持續(xù)性。真正的挑戰(zhàn)在于,如何將技術轉化為實際的生產力,解決用戶的真實需求,而不是簡單地堆砌技術。

然而,能看到的卻是大量公司在盲目跟風,試圖通過增加數(shù)據(jù)量、提升算力等手段來打造所謂的“大模型”。但這種做法往往忽略了客戶成功(CSM)的重要性,如何確保技術能夠真正滿足客戶需求,為客戶創(chuàng)造價值?

更為嚴重的是,許多公司并沒有清晰的業(yè)務規(guī)劃和階段性目標,像無頭蒼蠅一樣四處亂撞,結果往往是資源浪費和失敗。大模型公司應該更加聚焦于實際場景的應用和落地,而不是僅僅停留在技術層面的自嗨,這樣的認知應該早已共識,只不過問題尚未解決,市場也難有突破性的故事。

作者|鹿堯
本文由人人都是產品經理作者【新眸】,微信公眾號:【新眸】,原創(chuàng)/授權 發(fā)布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
14642人已学习14篇文章
BI的核心价值在于满足企业不同人群对数据查询、分析和探索的需求,从而帮助企业更好的管理与决策。本专题的文章分享了BI系统概述。
专题
12840人已学习15篇文章
知识付费是内容赛道上的一块高地,有着上百亿的市场规模。本专题的文章分享了关于对知识付费的观点。
专题
13294人已学习12篇文章
知识管理是什么?通常来看,想理解知识管理,可以从业务、管理、实施等视角切入。本专题的文章分享了如何做知识管理。
专题
13263人已学习14篇文章
各种大模型和AI绘画的产品层出不穷,在各行业也在尝试进行应用。在这个阶段,AIGC能实现些什么?本专题的文章分享了AIGC的应用。
专题
11681人已学习12篇文章
本专题的文章分享了营销增长指南。
专题
16230人已学习11篇文章
本专题分享了算法相关的知识,汇总了算法的基础知识和进阶知识。