現(xiàn)階段的大模型,發(fā)展在放緩,還是提速?
自從ChatGPT 4.0 發(fā)布之后,大家一方面期待著5.0的發(fā)布,一方面國內大模型開始卷智能體和應用,以至于有人開始懷疑:大模型是不是變慢了?這篇文章,希望可以解答你的疑問。
最近逛知乎聽到不少聲音:這波大模型是不是到了低谷期?感覺熱度不比以前了。等了一年都沒等來GPT-5,的確大模型更新速度也變慢了…
這個話題成功激發(fā)了我的好奇心,同時也引發(fā)了系列思考:
目前大模型的發(fā)展是否真如有的人所說在降溫降速?如果行業(yè)熱情和前景還在,那么今年以來,為什么國內外大模型的發(fā)展會給人們帶來這種感覺?有哪些深層次的原因在左右整個行業(yè)的發(fā)展走向?于是便有了此文。以下,共享~
一、這波大模型是否到了低谷期?
作為大模型賽道的一員,身在其中,筆者可能沒覺察到多少異樣。恰恰相反,個人感覺對比2023年,行業(yè)客戶對大模型及AI應用的接受度和商用認可度有增無減。尤其隨著越來越多大模型應用案例的成功落地,AI加速賦能千行百業(yè)正逐漸從“口號”變成現(xiàn)實。
如果說低谷是指“百模大戰(zhàn)”的新進參與者不再是野蠻增長的狀態(tài),或者現(xiàn)有大模型選手的更新頻次不同以往,個人覺得這或許是行業(yè)自然發(fā)展的一種映射。
畢竟大模型賽道本身具有一定進入門檻,只有前期擁有較深的技術沉淀和長期的蓄力的選手,才能獲得準入資格。在市場爆發(fā)的窗口期,有條件的選手基本已經搶先進入。即便有后來者,但在越發(fā)擁擠的賽道和逐漸激烈的市場競爭面前,再進入的一般不會太多。即便有,也可能另辟蹊徑,這是其一。
其二,因為基礎大模型一開始就很偏向于“巨頭間的游戲”,少數(shù)頭部玩家手握絕大多數(shù)的資金和資源,這使得這一賽道的新進入者,更容易在持續(xù)高投入面前望而卻步。相比之下,大模型應用賽道有更多發(fā)展可能,但在多方勢力角逐下,行業(yè)也在面臨洗牌,呈現(xiàn)“強者愈強,弱者愈弱”的局面。隨著市場格局逐漸成型,新加入的玩家少,也容易帶來行業(yè)降溫的錯覺。
從大模型廠商的產品更新看,雖然今年以來,很多主流玩家很難保持剛成立時“拼命三郎”式的更新頻率(比如百川智能在成立半年內接連發(fā)布baichuan-7B/13B、Baichuan-53B、Baichuan2-7B/13B等多款大模型產品),但整體的“上新”力度和性能提升依然可觀。
比如自2018年發(fā)布GPT-1以來,一直保持幾乎一年一次迭代的OpenAI,今年雖然沒帶來大眾期待已久的GPT-5,但推出的新一代大模型o1仍在業(yè)內引起了轟動,還開創(chuàng)了Scaling law定律外,不拼數(shù)據(jù)量,也能實現(xiàn)模型性能顯著提升的新思路。
OpenAI強有力的競爭對手Anthropic去年3月、7月、11月密集發(fā)布了Claude初版,Claude 2,Claude 2.1,今年節(jié)奏雖有放緩,但也在3月和10月先后發(fā)布Claude 3系列、升級版 Claude 3.5 Sonnet、新Claude 3.5 Haiku等模型,整體表現(xiàn)還算平穩(wěn)。
國內基礎大模型方面,阿里于今年5月發(fā)布通義千問2.5,6月百度上線文心大模型4.0 Turbo,百川智能在今年上半年先后發(fā)布千億參數(shù)大模型 Baichuan 3、角色大模型Baichuan-NPC、新基座大模型Baichuan 4,智譜年內陸續(xù)推出GLM-4、CogVideoX、GLM-4-Plus、GLM-4V-Plus…總體來看,國內主流大模型廠商其實動態(tài)不斷。
但為什么還是有人感覺大模型更新好像沒那么勤了,熱度也降了?
除了因高質量數(shù)據(jù)、算力等方面面臨瓶頸,導致模型代際周期受到一定影響(“大力出奇跡”式Scaling law策略不再那么有效可行)。筆者覺得,很大一部分原因,可能在于持續(xù)驚喜和刺激后帶來的情緒波動在變小。畢竟前期給到大眾模型性能越驚艷,后期除非有突破式進展,否則人們面對再多的水花也可能波瀾不驚。而目前拋開Scaling law另辟蹊徑,來大幅拓展AI大模型的能力邊界,需要時間,也需要大量的探索。這也推動著大模型廠商降低迭代速度,從“小步快跑”轉向長線運營。
此外,商業(yè)變現(xiàn)壓力也推動大模型廠商放慢迭代速度,轉向客戶轉化和服務。為此,我們也不難發(fā)現(xiàn):今年以來,國內外主流大模型廠商都在加快商業(yè)模式的完善和行業(yè)落地。當提升產品的適用性與性能,比起大量開發(fā)新品占有更多優(yōu)先級,也可能引起大模型發(fā)展放緩的錯覺。
二、大模型發(fā)展正呈現(xiàn)哪些趨勢?
目前基礎大模型及大模型應用賽道正穩(wěn)步前行,但仍呈現(xiàn)出一些代表性趨勢。
比如上面提到的AI大模型底層技術的對齊與進階。
就行業(yè)而言,現(xiàn)階段GPT-4 Turbo、新模型o1仍代表業(yè)界前沿水平,也是國內大模型爭相對標和趕超的對象。而就內部來說,推動新模型產品在性能、模型能力等方面,實現(xiàn)比以往大模型產品有顯著的提升和進階,這樣的舉措只會多,不會少。
其次,大模型多模態(tài)能力的開發(fā)正成為很多大模型服務商不約而同的選擇。尤其是視頻生成領域,今年以來,國內主流的基礎大模型廠商對標Sore,基本都推出了自己的重量級視頻生成模型。
摘自網(wǎng)絡公開信息,以上為不完全統(tǒng)計,僅供參考
從結果看,處于V2.0階段的視頻生成模型在提示詞還原度、物理模擬、畫面表現(xiàn)力、運動控制、運鏡控制、光影反射、主角統(tǒng)一、鏡頭切換、視頻長度、生成等待時長等方面均有不同程度的提升。加上視頻生成與廣告、影視、動畫、游戲等多領域的業(yè)務關聯(lián)與廣闊的商用前景,使得AI視頻生成模型雖然并非全新的賽道,卻因為能力方面的大幅躍遷,吸引到更多玩家布局。
大模型應用方面,雖然比拼的焦點不在視頻生成模型,但圖像理解、音頻理解、視頻理解等方面的能力和需求,在客服、銷售、營銷等場景的落地過程中的顯得越發(fā)強烈。以上推動當下一些大模型應用商深度打磨多模態(tài)能力,以更好地服務于相應業(yè)務場景。
與此同時,為了滿足復雜場景的應用需求,拓展大模型的能力邊界,發(fā)展AI agent(智能體)也正成為基礎大模型及應用廠商主動或被動的選擇。
比如越來越多的通用大模型廠商傾向于通過對智能體的探索,挖掘和自身業(yè)務更匹配的應用場景。而大模型應用廠商為了打造更智能、強大的AI應用產品,增強自身競爭優(yōu)勢,也陸續(xù)在智能體應用上投入更多的精力。
尤其是今年以來,包括微軟、谷歌、百度等在內的公司,在加大布局AI業(yè)務的同時,也加快推出了自己的AI智能體生態(tài)項目。而在實際落地中,AI公司利用智能體,豐富商業(yè)化場景的案例也相當普遍。
三、寫在最后
綜上,隨著現(xiàn)階段大模型市場的成熟度越來越高,行業(yè)逐漸告別野蠻生長的狀態(tài),從百花齊放走向開花結果。也許在時間長河中,行業(yè)有高潮,也有低谷,但高潮與低谷其實本身就是一種常態(tài),也是一種相對的狀態(tài),與其介懷,還不如一同前行。
在商業(yè)化壓力的推動下,國內外基礎大模型廠商紛紛和應用結合,并布局多模態(tài)能力、智能體等,以拓展AI的應用場景,加速通用人工智能的實現(xiàn),這點顯得有些不謀而合。
司普科技CEO張振廣先生曾在公開演講時表示:目前就AI大模型而言,世界牌桌上其實只有2.5個對手。特別是今年以來,大模型領域,中美的雙強格局越發(fā)明顯。
也許在底層技術上,國內之前大多處于追趕狀態(tài),但隨著新一波大模型尤其是多模態(tài)模型的深度發(fā)展,有些方面我們其實已經走在了前面。
備注:本文原創(chuàng),首發(fā)司普科技,第三方首發(fā)人人都是產品經理。
本文由 @iseeworld 原創(chuàng)發(fā)布于人人都是產品經理。未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!