亚洲乱码中文,97在线

淺談國產大模型的過去、現(xiàn)在以及未來

2024-08-21

0 評論 432 瀏覽 0 收藏

國產大模型技術自ChatGPT爆火之后迅速發(fā)展，但隨著時間的推移，熱潮逐漸降溫。本文將探討國產大模型從誕生至今的演進歷程，分析當前市場狀況及其面臨的挑戰(zhàn)，并展望未來的發(fā)展方向。文章通過深入分析，揭示了大模型技術在商業(yè)化和差異化方面的局限，同時指出了技術發(fā)展與市場需求之間的差距。

怎樣去衡量一款AI產品是否成功？

這個問題如果放在兩年前，很多人給出的答案會集中在AI的狹義領域，AlphaGo、Siri、Google Assistant，或是用于解鎖手機的圖像識別技術，能夠在某個特定的領域完成特定的任務。

但從2023年開始，也就是ChatGPT火了之后，人們對AI的看法發(fā)生了一些轉變，學習、適應、推理的自主決策的能力，不免讓人產生AGI會成為現(xiàn)實的錯覺。

所以我們能看到，在ChatGPT發(fā)布后的不到兩年里，國內就上線了數(shù)百個大模型，里面既有互聯(lián)網(wǎng)大公司，也有各種垂類公司，還有一批跑在風口上的初創(chuàng)企業(yè)。

毫無疑問，AI大模型的研發(fā)需要投入大量的資金和人才，這也導致了絕大部分初創(chuàng)公司的估值被嚴重透支，他們在短期內獲得了大量融資，后續(xù)卻無法持續(xù)燒錢維持迭代和商業(yè)落地，隨著投資人信心下降，不免有一些機構選擇清倉或撤資。

大浪淘沙，伴隨無休止的套殼和再生的游戲，當下市面上能夠接觸到的模型主要分為兩類。一是基礎通用大模型，比如文心一言、通義千問、元寶這類大廠產品，它們應用場景廣泛，功能包括但不限于文本生成、語言理解、問答系統(tǒng)、摘要提取、機器翻譯等。某種程度上，它們可以作為下游任務的基礎模型，通過微調或遷移學習，適應不同的應用場景和需求。

其次是行業(yè)專用，各類細分賽道的產出，像金山的政務大模型，多家公司的醫(yī)療、金融等大模型，應用場景主要集中在各自的專業(yè)領域內。例如，醫(yī)療大模型可以應用于電子病歷分析、疾病預測、藥物研發(fā)等多個環(huán)節(jié)；金融大模型則可以應用于風險評估、投資策略制定、客戶畫像構建等多個方面。

做到这三点挑战，产品经理只会不断升值

好的产品经理是很稀缺的，懂用户、懂商业、懂数据的产品经理走出互联网，依然是抢手货。相反，如果只做简单传话、低效执行、浅层思考的产品经理，恐怕走不过未来3-5年的洪流。

查看详情 >

如果僅從數(shù)字上看，國產大模型在技術上的確成長很快，根據(jù)SuperCLUE的評測結果，國內絕大部分閉源模型已超過GPT-3.5Turbo。但事實上，這樣的比較意義并不大，大模型雖然多，技術代差也在縮小，但商業(yè)化、差異化但效果并不明顯，以至于大多數(shù)投資人回歸到觀望的態(tài)度。

前段時間圈子里比較熱的幾個話題，Kimi母公司月之暗面在2C業(yè)務之外，官宣了Kimi企業(yè)級API的正式發(fā)布，比通用模型有更高等級的數(shù)據(jù)安全保障和并發(fā)速率；智譜AI發(fā)布“Z計劃”，開始、轉型投資人的身份。

縱觀五虎里剩下的百川智能、零一萬物、MiniMax三家公司，推出的產品也很難打出真正的差異化，C端主要提升聽說讀寫技能，產業(yè)端則作為私有數(shù)據(jù)平臺和簡化復雜需求的工具。一股勁兒地都在鉆技術，較量百萬，頂多千萬級的日活，但市場一直缺乏能夠承載AI的殺手級應用。

這樣一來，逐漸聚焦于一個關鍵議題：盡管我們不斷追求更大的數(shù)據(jù)量、更強的計算能力以及更復雜的模型訓練，以期構建出更加智能的大模型，但這一過程中往往忽視了一個至關重要的前提：這些高級模型的有效運用與推進，離不開專業(yè)人員的深度參與和專業(yè)方法的精準實施。

當我們試圖將這些大模型直接應用于具體場景，如新聞資訊平臺或金融領域時，面臨的挑戰(zhàn)便顯現(xiàn)出來。比如在面對如抖音、快手等已高度優(yōu)化用戶畫像的平臺時，大模型似乎并未能帶來顯著的變革性影響。這并非因為大模型本身不具備潛力，而是其在實際應用中的定制化與精準化需求遠未被充分滿足。

進一步來講，如果將大模型應用于傳統(tǒng)制造業(yè)或低門檻工作領域，同樣面臨嚴峻挑戰(zhàn)。

過去人們以為，通過大模型的指導，即便是非專業(yè)人士也能輕松勝任高技能要求的崗位。然而，現(xiàn)實卻遠非如此。社會的工作分工與評價體系依然根深蒂固，強調經驗積累與行業(yè)專業(yè)性。這意味著，僅憑大模型的短期培訓，很難讓一個普通人迅速跨越行業(yè)門檻，達到專業(yè)水準。

一個無法忽視的問題是，不同企業(yè)、不同業(yè)務應當如何設定合理且科學的增長標準，以及在缺乏直接參照對象時，如何衡量并規(guī)劃業(yè)務的未來增長。

在觀察當前市場上的AI大模型產品時，起初，這些技術可能憑借其新穎性和創(chuàng)新性吸引了大量關注，但隨著技術的成熟和市場的飽和，增長動力逐漸減弱。

事實上，許多高估值的產品往往是在某個小眾領域進行了深度挖掘和創(chuàng)新。這些問題極具普遍性，橫跨了不同企業(yè)和業(yè)務領域，例如，拼多多通過重塑電商體驗，為消費者帶來了全新的購物感受；京東則憑借其強大的物流體系，構建了難以復制的供應鏈壁壘。

對于當前的大模型技術而言，發(fā)展方向應當更加注重用戶體驗和市場需求的結合。當這些技術被嵌入到如WPS這樣的辦公軟件，或是美團這樣的服務平臺中時，核心問題在于，如何讓AI技術更好地服務于用戶需求，而不是僅僅停留在表面或淺層次的分析上。

舉個例子，用戶讓AI軟件猜測自己想吃什么，它們的確會通過語義分析來理解用戶的意圖，并給出一些建議或推薦。然而，這些推薦往往停留在較為寬泛的層面，沒有真正深入到用戶的個性化需求中。

換句話說，因為當前的AI技術還難以完全理解用戶的復雜情感和具體需求，只能基于已有的數(shù)據(jù)和模型進行大致的預測和推薦；另一方面，讓AI猜測人的已有目的，這件事本身就很浪費時間和技術資源。

再以翻譯為例，假設我們已經能夠將翻譯精度提升到99%，而市場上的需求僅需要95.6%的準確度。這時，再花費大量資源去將精度從99%提升至99.5%，是否真的有意義？尤其是當這種提升對于大多數(shù)用戶來說，并無顯著差別時。

這里的核心問題是，從商業(yè)角度來審視技術的ROI（投資回報率）和ROE（凈資產收益率）。在一個技術概念成為風口時，往往過分強調技術的先進性，而忽略了其在實際應用中的價值和可持續(xù)性。真正的挑戰(zhàn)在于，如何將技術轉化為實際的生產力，解決用戶的真實需求，而不是簡單地堆砌技術。

然而，能看到的卻是大量公司在盲目跟風，試圖通過增加數(shù)據(jù)量、提升算力等手段來打造所謂的“大模型”。但這種做法往往忽略了客戶成功（CSM）的重要性，如何確保技術能夠真正滿足客戶需求，為客戶創(chuàng)造價值？

更為嚴重的是，許多公司并沒有清晰的業(yè)務規(guī)劃和階段性目標，像無頭蒼蠅一樣四處亂撞，結果往往是資源浪費和失敗。大模型公司應該更加聚焦于實際場景的應用和落地，而不是僅僅停留在技術層面的自嗨，這樣的認知應該早已共識，只不過問題尚未解決，市場也難有突破性的故事。

作者｜鹿堯
本文由人人都是產品經理作者【新眸】，微信公眾號：【新眸】，原創(chuàng)/授權發(fā)布于人人都是產品經理，未經許可，禁止轉載。

題圖來自Unsplash，基于 CC0 協(xié)議。

更多精彩內容，請關注人人都是產品經理微信公眾號或下載App

淺談國產大模型的過去、現(xiàn)在以及未來

淺談國產大模型的過去、現(xiàn)在以及未來