国产伦精品一区二区,最新国产在线观看福利

搜索

APP

起點課堂會員權益

職業(yè)體系課特權

線下行業(yè)大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

發(fā)布

注冊 | 登錄

現(xiàn)階段的大模型，發(fā)展在放緩，還是提速？

iseeworld

2024-12-07

0 評論 3596 瀏覽 0 收藏

11 分鐘

自從ChatGPT 4.0 發(fā)布之后，大家一方面期待著5.0的發(fā)布，一方面國內大模型開始卷智能體和應用，以至于有人開始懷疑：大模型是不是變慢了？這篇文章，希望可以解答你的疑問。

最近逛知乎聽到不少聲音：這波大模型是不是到了低谷期？感覺熱度不比以前了。等了一年都沒等來GPT-5，的確大模型更新速度也變慢了…

這個話題成功激發(fā)了我的好奇心，同時也引發(fā)了系列思考：

目前大模型的發(fā)展是否真如有的人所說在降溫降速？如果行業(yè)熱情和前景還在，那么今年以來，為什么國內外大模型的發(fā)展會給人們帶來這種感覺？有哪些深層次的原因在左右整個行業(yè)的發(fā)展走向？于是便有了此文。以下，共享~

一、這波大模型是否到了低谷期？

作為大模型賽道的一員，身在其中，筆者可能沒覺察到多少異樣。恰恰相反，個人感覺對比2023年，行業(yè)客戶對大模型及AI應用的接受度和商用認可度有增無減。尤其隨著越來越多大模型應用案例的成功落地，AI加速賦能千行百業(yè)正逐漸從“口號”變成現(xiàn)實。

如果說低谷是指“百模大戰(zhàn)”的新進參與者不再是野蠻增長的狀態(tài)，或者現(xiàn)有大模型選手的更新頻次不同以往，個人覺得這或許是行業(yè)自然發(fā)展的一種映射。

畢竟大模型賽道本身具有一定進入門檻，只有前期擁有較深的技術沉淀和長期的蓄力的選手，才能獲得準入資格。在市場爆發(fā)的窗口期，有條件的選手基本已經搶先進入。即便有后來者，但在越發(fā)擁擠的賽道和逐漸激烈的市場競爭面前，再進入的一般不會太多。即便有，也可能另辟蹊徑，這是其一。

其二，因為基礎大模型一開始就很偏向于“巨頭間的游戲”，少數(shù)頭部玩家手握絕大多數(shù)的資金和資源，這使得這一賽道的新進入者，更容易在持續(xù)高投入面前望而卻步。相比之下，大模型應用賽道有更多發(fā)展可能，但在多方勢力角逐下，行業(yè)也在面臨洗牌，呈現(xiàn)“強者愈強，弱者愈弱”的局面。隨著市場格局逐漸成型，新加入的玩家少，也容易帶來行業(yè)降溫的錯覺。

從大模型廠商的產品更新看，雖然今年以來，很多主流玩家很難保持剛成立時“拼命三郎”式的更新頻率（比如百川智能在成立半年內接連發(fā)布baichuan-7B/13B、Baichuan-53B、Baichuan2-7B/13B等多款大模型產品），但整體的“上新”力度和性能提升依然可觀。

比如自2018年發(fā)布GPT-1以來，一直保持幾乎一年一次迭代的OpenAI，今年雖然沒帶來大眾期待已久的GPT-5，但推出的新一代大模型o1仍在業(yè)內引起了轟動，還開創(chuàng)了Scaling law定律外，不拼數(shù)據(jù)量，也能實現(xiàn)模型性能顯著提升的新思路。

OpenAI強有力的競爭對手Anthropic去年3月、7月、11月密集發(fā)布了Claude初版，Claude 2，Claude 2.1，今年節(jié)奏雖有放緩，但也在3月和10月先后發(fā)布Claude 3系列、升級版 Claude 3.5 Sonnet、新Claude 3.5 Haiku等模型，整體表現(xiàn)還算平穩(wěn)。

國內基礎大模型方面，阿里于今年5月發(fā)布通義千問2.5，6月百度上線文心大模型4.0 Turbo，百川智能在今年上半年先后發(fā)布千億參數(shù)大模型 Baichuan 3、角色大模型Baichuan-NPC、新基座大模型Baichuan 4，智譜年內陸續(xù)推出GLM-4、CogVideoX、GLM-4-Plus、GLM-4V-Plus…總體來看，國內主流大模型廠商其實動態(tài)不斷。

但為什么還是有人感覺大模型更新好像沒那么勤了，熱度也降了？

除了因高質量數(shù)據(jù)、算力等方面面臨瓶頸，導致模型代際周期受到一定影響（“大力出奇跡”式Scaling law策略不再那么有效可行）。筆者覺得，很大一部分原因，可能在于持續(xù)驚喜和刺激后帶來的情緒波動在變小。畢竟前期給到大眾模型性能越驚艷，后期除非有突破式進展，否則人們面對再多的水花也可能波瀾不驚。而目前拋開Scaling law另辟蹊徑，來大幅拓展AI大模型的能力邊界，需要時間，也需要大量的探索。這也推動著大模型廠商降低迭代速度，從“小步快跑”轉向長線運營。

此外，商業(yè)變現(xiàn)壓力也推動大模型廠商放慢迭代速度，轉向客戶轉化和服務。為此，我們也不難發(fā)現(xiàn)：今年以來，國內外主流大模型廠商都在加快商業(yè)模式的完善和行業(yè)落地。當提升產品的適用性與性能，比起大量開發(fā)新品占有更多優(yōu)先級，也可能引起大模型發(fā)展放緩的錯覺。

二、大模型發(fā)展正呈現(xiàn)哪些趨勢？

目前基礎大模型及大模型應用賽道正穩(wěn)步前行，但仍呈現(xiàn)出一些代表性趨勢。

比如上面提到的AI大模型底層技術的對齊與進階。

就行業(yè)而言，現(xiàn)階段GPT-4 Turbo、新模型o1仍代表業(yè)界前沿水平，也是國內大模型爭相對標和趕超的對象。而就內部來說，推動新模型產品在性能、模型能力等方面，實現(xiàn)比以往大模型產品有顯著的提升和進階，這樣的舉措只會多，不會少。

其次，大模型多模態(tài)能力的開發(fā)正成為很多大模型服務商不約而同的選擇。尤其是視頻生成領域，今年以來，國內主流的基礎大模型廠商對標Sore，基本都推出了自己的重量級視頻生成模型。

摘自網(wǎng)絡公開信息，以上為不完全統(tǒng)計，僅供參考

從結果看，處于V2.0階段的視頻生成模型在提示詞還原度、物理模擬、畫面表現(xiàn)力、運動控制、運鏡控制、光影反射、主角統(tǒng)一、鏡頭切換、視頻長度、生成等待時長等方面均有不同程度的提升。加上視頻生成與廣告、影視、動畫、游戲等多領域的業(yè)務關聯(lián)與廣闊的商用前景，使得AI視頻生成模型雖然并非全新的賽道，卻因為能力方面的大幅躍遷，吸引到更多玩家布局。

大模型應用方面，雖然比拼的焦點不在視頻生成模型，但圖像理解、音頻理解、視頻理解等方面的能力和需求，在客服、銷售、營銷等場景的落地過程中的顯得越發(fā)強烈。以上推動當下一些大模型應用商深度打磨多模態(tài)能力，以更好地服務于相應業(yè)務場景。

與此同時，為了滿足復雜場景的應用需求，拓展大模型的能力邊界，發(fā)展AI agent（智能體）也正成為基礎大模型及應用廠商主動或被動的選擇。

比如越來越多的通用大模型廠商傾向于通過對智能體的探索，挖掘和自身業(yè)務更匹配的應用場景。而大模型應用廠商為了打造更智能、強大的AI應用產品，增強自身競爭優(yōu)勢，也陸續(xù)在智能體應用上投入更多的精力。

尤其是今年以來，包括微軟、谷歌、百度等在內的公司，在加大布局AI業(yè)務的同時，也加快推出了自己的AI智能體生態(tài)項目。而在實際落地中，AI公司利用智能體，豐富商業(yè)化場景的案例也相當普遍。