百度文心4.5與X1登場后,大模型第一梯隊的競爭再升級?

Tech星球
0 評論 636 瀏覽 0 收藏 15 分鐘
🔗 产品经理的不可取代的价值是能够准确发现和满足用户需求,把需求转化为产品,并协调资源推动产品落地,创造商业价值。

前幾天,百度正式發(fā)布文心大模型4.5(文心4.5)和文心大模型X1(文心X1),并宣布文心4.5將于6月30日正式開源,這一系列動作引發(fā)了行業(yè)的廣泛關(guān)注。百度的這一戰(zhàn)略布局不僅是對“掉隊”質(zhì)疑的有力回應(yīng),也標志著大模型競爭進入了一個新的階段。

3月16日,百度正式發(fā)布文心大模型4.5(以下簡稱文心4.5)及文心大模型X1(以下簡稱文心X1),在文心一言官網(wǎng)即可免費使用。

文心4.5不僅在基礎(chǔ)能力上有大幅度提升,且具備原生多模態(tài)等能力,其多項基準測試成績優(yōu)于GPT4.5、DeepSeek-V3等,并且平均分達到79.6分,高于GPT4.5的79.14。

文心X1不僅在性能上對標DeepSeek-R1,且具備更強的理解、規(guī)劃、反思、進化能力,并支持多模態(tài),是首個自主運動工具的深度思考模型。和DeepSeek橫空出世一樣,文心4.5和文心X1不僅點燃了國內(nèi)用戶的熱情,更讓外網(wǎng)沸騰。

在推特上,不少人紛紛在求百度測試賬號,他們?yōu)閮纱竽P蛢?yōu)異的性能和超低的價格感到不可思議,不少人覺得百度的股價被低估了。甚至有人在百度推特賬號下@薩姆·奧爾特曼,他們表示游戲結(jié)束了。

在看到文心新模型的表現(xiàn)后,在推特上擁有70萬粉絲的美國投資人Bill Gurley感慨道,美國人工智能公司應(yīng)將100%的時間用于開發(fā)和創(chuàng)新,而不是在華盛頓特區(qū)游說尋求保護以躲避競爭。這種情況很糟糕,明顯暴露出缺乏自信。

兩大模型的優(yōu)異能力,是對過去3月外界對于“百度大模型掉隊了”最有效的回應(yīng),也再一次證明了百度對AI戰(zhàn)略貫徹到底的決心。

畢竟,大模型競技是一場持久戰(zhàn),拼的是耐力、技術(shù)、資本。從Transformer到OpenAI-o1和DeepSeek-R1,技術(shù)的更新時刻在發(fā)生,沒有人可以保證永遠領(lǐng)先,但關(guān)鍵的是敢拼的勇氣。所有玩家從來沒有放棄和停止在大模型領(lǐng)域的努力,百度也是如此。

開年以來,百度在大模型領(lǐng)域動作頻頻——文心一言完全免費、文心4.5將于6月30日正式開源;百度核心業(yè)務(wù)搜索接入DeepSeek;很快百度還會發(fā)布4.5系列模型,以及更前沿的下一代模型5.0版本。動作頻頻的背后,透露出百度依然想留在牌桌上的決心,它也確實做到了。

但百度并不能掉以輕心。因為,大模型的終局遠未到來,包括百度在內(nèi),所有的玩家都必須全力以赴。這也是百度堅持不懈的根源。

01 百度加速變革:一場必要的戰(zhàn)略糾偏

半個月之前,OpenAI舉辦了一場線上發(fā)布會,正式發(fā)布了其最新一代基礎(chǔ)模型GPT-4.5。3月16日,百度并沒有任何發(fā)布動作,而是直接上線了文心4.5與文心X1。

這場上線發(fā)生得悄無聲息。有百度內(nèi)部人士稱,無論是文心4.5全面免費,還是PC和移動兩端直接上線,百度管理層都是在半天之內(nèi)做出的決策。

這似乎是現(xiàn)在的百度與過去的百度,以及行業(yè)的一場賽跑。

這一次的百度越來越快了。據(jù)百度方面透露,此次文心4.5和X1大模型發(fā)布之后,百度后續(xù)還會推出文心4.5系列模型,以及在下半年推出更先進的下一代模型5.0版本。

其實,此次模型迭代進程明顯加快,并非偶然。這一現(xiàn)象背后,其實是百度對過往策略選擇的反思與積極糾偏。

過去半年間,DeepSeek等新興公司憑借開源、低成本的模式,給OpenAI、百度這類傳統(tǒng)大模型巨頭帶來了不小的壓力。如今,全球AI企業(yè)中,無論是OpenAI,還是百度,都逐漸意識到,大模型領(lǐng)域未來走向依舊充滿變數(shù),尚無定論。

激烈競爭的大模型領(lǐng)域,保持競爭力的關(guān)鍵在于果敢地 “求變”。于是,就在今年2月,比OpenAI更快一步,百度決定及時轉(zhuǎn)變策略。

隨后,百度創(chuàng)始人李彥宏就快速且堅決地推動了一系列動作:文心一言免費、核心業(yè)務(wù)搜索接入DeepSeek、文心大模型4.5系列將在6月30日正式開源等。

這次糾偏是文心一言對當(dāng)下市場競爭的直接回應(yīng)。從悄然上線文心4.5與X1,以及后續(xù)透露的一系列迭代計劃,無一不彰顯出百度謀求變革的堅定決心。

不過,百度突然加快腳步,讓外界有人質(zhì)疑它可能會迷失方向。但目前來看,百度的“變快”建立在對自身技術(shù)實力與市場趨勢的研判上,每一次模型的迭代都伴隨著技術(shù)架構(gòu)的深度優(yōu)化,以及性能的飛躍提升。

從百度自有業(yè)務(wù)來看,百度旗下多款用大模型重構(gòu)后的AI應(yīng)用,包括百度App、百度地圖、百度網(wǎng)盤、百度文庫等體驗感都在持續(xù)提升。在此次文心4.5與文心X1上線后,這些應(yīng)用也在迎來全方位升級。

02 讓大模型產(chǎn)品,植入“原生技術(shù)內(nèi)核”

作為百度重回牌桌的階段性產(chǎn)品,原生多模態(tài)大模型文心4.5以及深度思考模型文心X1,究竟在哪些方面實現(xiàn)了蛻變與升級?

據(jù)了解,文心4.5是百度自主研發(fā)的新一代原生多模態(tài)大模型,通過多個模態(tài)聯(lián)合建模實現(xiàn)協(xié)同優(yōu)化,多模態(tài)理解能力優(yōu)秀;具備更精進的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯推理、代碼能力顯著提升。

而文心大模型X1具備更強的理解、規(guī)劃、反思、進化能力,并支持多模態(tài),是首個自主運用工具的深度思考模型,兼?zhèn)錅蚀_、創(chuàng)意和文采。基于文心大模型4.5和文心大模型X1,Tech星球分別實測了一些應(yīng)用場景。

我們上傳了一段“體重管理年”的新聞視頻,要求文心4.5概括新聞內(nèi)容,可以看到其給出了準確的回答,證明了其跨模態(tài)的能力。目前,文心4.5支持上傳的視頻文件,兼容常見的格式,單個視頻文件大小不超過20M。

在圖片理解上,通過這個問題也能夠看出在圖形推理、圖表分析的“高智商”以外,文心4.5還具備了理解梗圖、漫畫、歌曲、電影等多模態(tài)內(nèi)容的“高情商”。

此外,文心4.5的能力也在圖片生成、RAG(Retrieval Augmented Generation檢索生成增強)測試、邏輯測試、文本創(chuàng)作等方面得到了很好地體現(xiàn)。在文心X1的測試中能夠看到,作為一個能力更全面的深度思考模型,其在邏輯問題中展現(xiàn)了周密的思考過程,且在答案的輸出上更為明確、直接。

在文本創(chuàng)作類的問題中,也能夠看出文心X1擅長寫“銳評”,避免“端水”,回答尖銳有態(tài)度。

Tech星球獲悉,文心X1在技術(shù)層面頗具創(chuàng)新,主要運用遞進式強化學(xué)習(xí)訓(xùn)練方法,以思維鏈和行動鏈為依托開展端到端訓(xùn)練,還構(gòu)建起統(tǒng)一的獎勵系統(tǒng),融入多元獎勵機制。

憑借這些技術(shù),文心X1能夠在諸多場景中大顯身手,包括中文知識問答、文學(xué)創(chuàng)作、文稿寫作、日常對話、邏輯推理、復(fù)雜計算等。此外,多工具調(diào)用是文心X1的特色之一。

目前,X1已支持高級搜索、文檔問答、圖片理解、AI繪圖、代碼解釋器、網(wǎng)頁鏈接讀取、TreeMind樹圖、百度學(xué)術(shù)檢索、商業(yè)信息查詢、加盟信息查詢、詞云生成等多款工具。

03 技術(shù)+場景,大模型的生態(tài)戰(zhàn)

今年2月11日,李彥宏參加“世界政府峰會”WGS 訪談時曾表示,從技術(shù)的基礎(chǔ)要素來看,核心主題依然是技術(shù)進步得非???。

成本每年降低約90%,并且性能越來越好。當(dāng)技術(shù)發(fā)展如此之快,你必須持續(xù)投入,以確保處于技術(shù)創(chuàng)新的最前沿。換句話說,大模型的競爭首先是技術(shù)實力的競爭,最直觀的體現(xiàn)是價格。

文心4.5輸入價格為0.004元/千tokens,輸出0.016元/千tokens,約為GPT4.5價格的1%;文心X1定價為輸入0.002元/千tokens,輸出0.008元/千tokens,是DeepSeek R1的一半。

效率得以大幅度提升,背后是百度通過全棧自研能力構(gòu)建了“芯片層、框架層、模型層和應(yīng)用層”的競爭壁壘。

從昆侖芯三代萬卡集群的算力支撐,到飛槳深度學(xué)習(xí)平臺的開發(fā)者生態(tài),再到文心大模型體系的多層次迭代以及AI重構(gòu)的百度搜索、近億用戶的百度文庫,每一層都有反饋,通過不斷獲得反饋,實現(xiàn)了端到端優(yōu)化,大幅度提升效率。

這也是百度近十年累計研發(fā)費用超過1800億元的正向反饋。

成本的降低讓百度有了實現(xiàn)AI普惠的底氣,也為接下來文心4.5的開源打下了堅實的基礎(chǔ)。

通過開放模型權(quán)重、訓(xùn)練框架等核心能力,吸引開發(fā)者共建,百度會擁有更加繁榮的開發(fā)生態(tài),構(gòu)建更深的護城河。因為開源不僅是技術(shù)輸出,更是生態(tài)卡位。文心一言將于4月1日取消59.9元/月的付費墻,免費開放表面看是“割肉”,實則是雙贏。

這種“零門檻”的模式,讓更多人可以享受技術(shù)進步帶來的樂趣。同時,百度在4.3億用戶基數(shù)的基礎(chǔ)上得以形成更大的數(shù)據(jù)飛輪效應(yīng),驅(qū)動模型持續(xù)優(yōu)化。

開源和免費的戰(zhàn)略轉(zhuǎn)向是百度應(yīng)對行業(yè)變局的標志性動作,它讓每一個人都可以參與到創(chuàng)新中來。

就像李彥宏所言,“創(chuàng)新不能被計劃,你不知道創(chuàng)新何時到來,你所能做的就是營造一個有利于創(chuàng)新的環(huán)境?!备匾氖?,技術(shù)的終局從來不是參數(shù)的比拼,而是在于解決現(xiàn)實生活中的問題。

百度已經(jīng)將這種理念落地實踐。被AI深度重構(gòu)的百度搜索有超過20%的頁面含有AI生成的內(nèi)容,近億用戶使用的百度文庫可以智能生成PPT、文檔,已經(jīng)成為“一站式AI內(nèi)容創(chuàng)作平臺”,其AI功能月活達9000萬。

更進一步看,大模型比拼的不僅僅是技術(shù)實力,更是一場以技術(shù)生態(tài)為核心、以場景落地為驅(qū)動的生態(tài)戰(zhàn)爭。

這也是百度和其他創(chuàng)業(yè)公司的根本區(qū)別,百度旗下?lián)碛袃|級用戶的搜索、地圖、文庫等應(yīng)用都是AI的落地試驗場。不僅如此,百度智能云千帆大模型平臺預(yù)置了包括百度文心大模型在內(nèi)的、國內(nèi)外上百個主流基礎(chǔ)大模型和行業(yè)大模型,還為大模型的持續(xù)預(yù)訓(xùn)練、精調(diào)、評估、壓縮和部署等環(huán)節(jié)提供最完善易用的工具鏈,它已經(jīng)幫助客戶精調(diào)了3.3萬個模型、開發(fā)了77萬個企業(yè)應(yīng)用。

站在大模型爆發(fā)的前夜,百度的轉(zhuǎn)向證明:AI的未來屬于激活生態(tài)的玩家,而非單一技術(shù)的掌控者。

當(dāng)開源成為行業(yè)標配,真正的競爭將聚焦于“如何讓每個人在創(chuàng)新中獲益”——這或許才是李彥宏“創(chuàng)新不能被計劃”斷言的終極答案。

文 | 任雪蕓

本文由人人都是產(chǎn)品經(jīng)理作者【Tech星球】,微信公眾號:【Tech星球】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Pixabay,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
29230人已学习16篇文章
系统如何恰当、清晰、及时地传达给用户操作的结果或者操作对象状态的变更?本专题的文章提供了有效的页面操作反馈设计指南。
专题
12667人已学习13篇文章
在产品的不同生命周期,需要有对应的产品战略以应对市场。本专题的文章分享了如何做好产品战略规划。
专题
11592人已学习12篇文章
对着互联网行业的不断发展,如今很多传统行业都与互联网想结合,医药行业也不例外。本文作者分享了关于互联网医疗的运营知识。
专题
141174人已学习32篇文章
做一个好运营,技术和意识都得过硬。
专题
17535人已学习13篇文章
在精细化运营的过程中,为自己的产品搭建一套数据指标体系,对于促进产品和业务增长是至关重要的。本专题的文章分享了如何搭建数据指标体系。