被掃地出門18個月后,馬斯克終復仇OpenAI

鯨選AI
0 評論 866 瀏覽 0 收藏 11 分鐘
🔗 B端产品经理需要进行售前演示、方案定制、合同签订等,而C端产品经理需要进行活动策划、内容运营、用户激励等

18個月前,馬斯克被OpenAI掃地出門;18個月后,他帶著Grok 3強勢回歸,直接將OpenAI拉下神壇。

昨天,馬斯克發(fā)布的Grok 3大模型不僅在性能上超越了OpenAI的GPT-4o,還在推理、編程和多模態(tài)能力上展現(xiàn)出驚人的實力。

從被踢出OpenAI到創(chuàng)建xAI實驗室,再到如今的復仇成功,馬斯克用“暴力開源”策略撕裂了OpenAI的閉源壁壘。而OpenAI的山姆·奧特曼也毫不示弱,聲稱GPT-4.5將帶來AGI的初體驗。

這場AI領域的權力天平正在傾斜,而開源與閉源的路線之爭,或許才是這場戰(zhàn)爭的真正焦點。

2月18日,馬斯克發(fā)布完Grok 3大模型后,轉(zhuǎn)發(fā)了一條推特:

劃重點,Grok3目前世界第一強模型(競技場得分1400),比OpenAI的推理模型還厲害,18個月就超越了山姆·奧特曼領導下的OpenAI。

要知道馬斯克曾是OpenAI的天使投資人,甚至Open這個關鍵詞就是馬斯克幫取名的。變化發(fā)生在2018年,奧特曼與馬斯克在“開源還是閉源”的問題上徹底決裂。馬斯克堅信,人工智能必須透明開放以規(guī)避風險;而奧特曼則在資本壓力下選擇與微軟結(jié)盟,將技術封閉于商業(yè)護城河內(nèi)。

此前大家都相安無事,因為當時ChatGPT還沒那么厲害。就在2022年末,ChatGPT4橫空出世后,馬斯克對于被踢出了這么一個跨時代項目,就開始碎碎念了。應了那句話:『不怕分手,就怕前任過得好。

這段往事在2024年再度被點燃。馬斯克以“違背公益初衷”為由,對OpenAI發(fā)起訴訟,指控其將技術壟斷權拱手讓給微軟。這場官司雖未勝訴,卻為馬斯克埋下了一顆復仇的種子——2023年7月,馬斯克成立xAI實驗室,開始發(fā)布Grok系列模型,對標OpenAI的GPT系列模型。

01 大力出奇跡,18個月追上OpenAI

在Grok3發(fā)布會上,開場xAI介紹了他們的決心:

『122天,建成了10萬顯卡集群,再過了92天后,建成了20萬張 H100 顯卡集群。』這是世界上最大的H100算力集群。

很多朋友不懂這個數(shù)據(jù)的意義,這意味著Grok3訓練算力超過了DeepSeek V3的263倍,卻只帶來超過DeepSeek 33%的Benchmark能力。

Scaling Law是否失效暫且不提,就說這大手筆投入算力基礎設施,也算是體現(xiàn)了馬斯克追趕的決心。

短短2年內(nèi),xAI接連推出Grok系列模型:從參數(shù)量為3140億的Grok-1,到支持多模態(tài)的Grok-1.5 Vision,追趕ChatGPT 4o的Grok 2,以及今天登頂?shù)腉rok 3,Grok每一步都試圖用“暴力開源”策略撕裂OpenAI的閉源壁壘。

重要時間節(jié)點是在2024年底。xAI在田納西州孟菲斯建成了一座堪比“算力核電站”的數(shù)據(jù)中心,10萬塊英偉達H100 GPU組成的集群,讓Grok 3的訓練速度比前代提升十倍。馬斯克在推特上寫道:“算力即權力,而我們將擁有最暴力的武器?!?/p>

此后馬斯克宣布融資60億美元,繼續(xù)投資Grok大模型的訓練。這筆錢比國內(nèi)大模型六小虎的融資總額還多。

在xAI成立的18個月(不到2年時間)后,Grok 3正式發(fā)布,成功登頂最強大模型。

02 Grok 3的“量子躍升”,有何殺手锏?

2025年2月18日,全球百萬觀眾涌入直播平臺,見證馬斯克的最新大模型,此前他在中東的AI大會上,宣布將發(fā)布全球最聰明的大模型Grok 3?,F(xiàn)在看來Grok 3名副其實,具有諸多強悍能力。

技術核爆點一:最聰明的模型

基準測試數(shù)據(jù)顯示,Grok 3達到了1400的Elo得分,這是其他任何模型都未曾達到的。

Grok 3在AIME 2025科學推理測試中得分超過Gemini 2 Pro和GPT-4o,其迷你版模型甚至在編程任務中擊敗了DeepSeek-R1。

可能大家已經(jīng)被大模型刷榜測試的傳聞,搞得不太相信這些數(shù)據(jù)的真實性。國外有拿到Grok 3測試的大神,測試了超過人類和一些大模型理解的《卡坦島》問題:。

“創(chuàng)建一個顯示六邊形網(wǎng)格的棋盤游戲網(wǎng)頁,就像游戲中的 Settlers of Catan 一樣。每個六邊形網(wǎng)格的編號從 1 到 N,其中 N 是六邊形瓷磚的總數(shù)。使其通用,以便可以使用滑塊更改“環(huán)”的數(shù)量。例如,在 Catan 中半徑為 3 個六邊形。請使用單個 html 頁面?!?/p>

他評價很少有模型能夠可靠地做到這一點。頂級的 OpenAI 思維模型(例如 o1-pro,每月 200 美元)也能做到這一點,但 DeepSeek-R1、Gemini 2.0 Flash Thinking 和 Claude 都沒有做到這一點。

甚至數(shù)學歷史上著名的未接知名『黎曼猜想』,Grok 3也會嘗試去算,不像O1-Pro、Claude等模型直接回答做不了,放棄了。

技術核爆點二:動態(tài)反思機制

Grok 3引入“思維鏈”推理技術,能像人類一樣拆解復雜任務并實時修正邏輯斷層?,F(xiàn)場演示中,Grok 3僅用30秒便生成了一份從地球到火星的航天器軌跡圖,并標注出引力彈弓效應的最佳利用節(jié)點。

『你能看到Grok真的在做一些模糊思考,這樣模型就不會被立即完全復制?!?/p>

圖中可以看到,在數(shù)學測試中,Grok-3 Reasoning Beta和Grok-3 mini Reasoning的91分和96分,超越了o3mini的87分、o1的83分和DeepSeek-R1的80分。

同樣在科學和編程兩項中,Grok3兩款模型也存在一定程度上的領先。

技術核爆點三:更多呈現(xiàn)模式

Grok 3不僅能解鎖測試時間計算,還能啟用強大的代理。這些能力促成了一款名為DeepSearch的新產(chǎn)品?!跋乱淮阉鞔恚糜诶斫庥钪妗?。DeepSearch還會展示它進行搜索時所采取的步驟。

不僅如此,Elon強調(diào)了Grok 3的創(chuàng)意涌現(xiàn)能力。在這個和DeepSeek十分相似的頁面上,Grok新增了第三個標簽按鈕『Big Brain』。使用“大腦模式”,通過更多計算資源和推理來使用Grok 3,也許會呈現(xiàn)意想不到的效果。

未來Grok 3應該不太限制大模型的創(chuàng)作風格,以及思考創(chuàng)意的邊界。相比之下,OpenAI則是解除了ChatGPT的成人內(nèi)容限制,這就。。。。。

03 口水戰(zhàn)打不完,奧特曼的反擊

面對Grok 3的突襲,OpenAI并非毫無動作。

發(fā)布會前天,山姆·奧特曼在X平臺宣稱:“GPT-4.5將帶來AGI的初體驗?!鳖A計GPT-4.5也會在一兩周內(nèi)發(fā)布,屆時拿出滿血的O3,應該能奪回全球最佳模型的寶座。

此前,一個由馬斯克牽頭的財團擬出價 974 億美元收購 OpenAI,后者的首席執(zhí)行官薩姆?阿爾特曼對此回應稱,” 不用了,謝謝,但如果你愿意,我們可以以 97.4 億美元的價格收購推特(即如今的 X)” 后。

商業(yè)競爭互相都不手軟,口水戰(zhàn)也打個不停。

未來兩家公司還存在路線競爭。與OpenAI的閉源策略針鋒相對,Grok 3承諾未來“開源”,Grok 2將在一個月內(nèi)開源,并計劃接入特斯拉車載系統(tǒng)和Optimus人形機器人。

同時,xAI同步推出了“Super Grok”訂閱服務,以每月49美元的價格向開發(fā)者開放深度搜索(DeepSearch)功能——這種能交叉驗證信息來源、公開推理路徑的引擎,直指ChatGPT的“黑箱”痛點。

更深層的沖擊來自生態(tài)層面。Grok 3的開源策略吸引了大量開發(fā)者涌入,而特斯拉的硬件布局(如Model Q車載系統(tǒng))則為AI落地提供了現(xiàn)實場景。

2025年,AI領域的權力天平正在傾斜。Grok 3的顛覆性不僅在于技術,更在于它重新點燃了“開源理想主義”的火種。正如一位硅谷投資人所言:“馬斯克用Grok 3完成了一場遲到的復仇,但這場戰(zhàn)爭的真正贏家,或許是那些終于看見技術透明曙光的人們?!?/p>

山姆·奧特曼會拿出怎樣的競爭手段回擊呢?

作者丨鯨哥

本文由人人都是產(chǎn)品經(jīng)理作者【AI鯨選社】,微信公眾號:【鯨選AI】,原創(chuàng)/授權 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
43106人已学习18篇文章
继蒸汽机、电力、互联网之后,区块链很可能是下一代颠覆性的核心技术。
专题
15508人已学习12篇文章
本专题的文章分享了交互设计文档的撰写指南。
专题
13110人已学习14篇文章
各种大模型和AI绘画的产品层出不穷,在各行业也在尝试进行应用。在这个阶段,AIGC能实现些什么?本专题的文章分享了AIGC的应用。
专题
15220人已学习12篇文章
本专题的文章分享了用户精细化运营---用户分群的建立指南。
专题
14842人已学习13篇文章
营销自动化是一个可用于自动执行营销任务的工具。本专题的文章分享了如何搭建自动化营销平台。
专题
12262人已学习16篇文章
栅格系统在页面排版布局、尺寸设定方面给了设计者直观的参考,它让页面设计变得有规律,从而减少了设计决策成本。本专题的文章分享了浅析栅格系统。