OpenAI和Google同日地震級(jí)更新:人間一夜,AGI 臨近!

鯨選AI
0 評(píng)論 2680 瀏覽 1 收藏 12 分鐘
🔗 B端产品需要更多地依赖销售团队和渠道合作来推广产品,而C端产品需要更多地利用网络营销和口碑传播来推广产品..

今天凌晨2點(diǎn),Google 和 OpenAI 在同一天發(fā)布了重大更新,引發(fā)了全球 AI 社區(qū)的強(qiáng)烈反響。Google 推出了 Gemini 2.5 Pro,一款能夠進(jìn)行復(fù)雜推理的混合大模型,而 OpenAI 則發(fā)布了 GPT-4o image generation,一款具有革命性的圖像生成技術(shù)。這兩個(gè)模型的發(fā)布不僅展示了兩家公司在 AI 領(lǐng)域的最新成就,也標(biāo)志著人類在通往通用人工智能(AGI)的道路上又邁出了重要一步。

誰是明日AI之星?

2024年,Google想奪回AI場子,但總是被OpenAI攪局。

每次一宣布某日要開發(fā)布會(huì),OpenAI就會(huì)提前發(fā)布實(shí)力更強(qiáng)的產(chǎn)品。導(dǎo)致每次Google的AI產(chǎn)品發(fā)布會(huì)都特別尷尬。

2025年的Google學(xué)聰明了,發(fā)布AI產(chǎn)品不再大張旗鼓,而是偷偷滴直接上線。這次今晚又沒任何預(yù)熱,Google直接上線了Gemini 2.5 Pro模型。

這是一款會(huì)推理的混合大模型,實(shí)力超越GPT4.5和Grok3 ,最大特點(diǎn)是能夠模仿人類快慢思考,這不是堪比GPT-5前奏嗎?而它就這么不聲不響上線了。

就在大家以為盛譽(yù)會(huì)屬于Google時(shí),OpenAI又在推特上宣布:

太平洋時(shí)間上午11點(diǎn)直播。

最終OpenAI發(fā)布了GPT-4o image generation,圖像生成技術(shù)模型。

具有媲美人類攝影的出圖質(zhì)量,隨心所欲的構(gòu)圖以及細(xì)節(jié)處理,超乎尋常的圖文理解,以及任意的圖中文字和LOGO生成的特性,也是在X上引起一片歡呼。

深夜2點(diǎn)多,鯨哥還沒睡覺,看到朋友圈很多人發(fā)北京地震了。于是我寫下如此朋友圈:

并沒有感受到北京地震,但此刻,正在被Google和OpenAI天雷勾地火的競爭震撼。熟睡中的普羅大眾,并不知道在這一夜中,在通往AGI 之路上,人類又躍進(jìn)了一大步!

無心睡眠,向AGI前進(jìn)一大步

Gemini 2.5炸裂出場,首個(gè)類人大模型

Gemini 2.5 Pro 實(shí)驗(yàn)版這次很炸裂,Gemini 2.5 號(hào)稱可以處理更復(fù)雜的編程、科學(xué)和數(shù)學(xué)問題,并支持更具有情境感知能力的智能體。

這個(gè)新的“思考模型”在 LMArena 上以顯著優(yōu)勢領(lǐng)先,并在數(shù)學(xué)、科學(xué)和編碼基準(zhǔn)測試中擊敗了 DeepSeek-R1、Grok 3 和 Claude 3.7。也幾乎全面優(yōu)于OPenAI家的兩款模型—o3-mini和GPT4.5。

Gemini 2.5 Pro 現(xiàn)在在競技排行榜上位居第一——這是有史以來最大的分?jǐn)?shù)跳躍(比 Grok-3/GPT-4.5 高出 40 分)。

配備100 萬 token 的上下文(即將推出 200 萬),能夠處理多模態(tài)數(shù)據(jù),并且經(jīng)過 vibe coding 認(rèn)證,可以僅通過一個(gè)提示構(gòu)建整個(gè)游戲。這是Gemini 2.5 的神奇之處。

更重要的是,當(dāng)你向 Gemini 2.5 提問時(shí),它會(huì)在回答之前通過思考進(jìn)行推理,模仿人類處理思想的方式—逐步接近問題,細(xì)化潛在解決方案,并選擇最佳方案。

鯨哥測試生成“近3年國內(nèi)直播帶貨KOL的動(dòng)態(tài)演示頁面”,2.5 Pro飛速生成了相關(guān)代碼。

這里就需要提到Google AI的亮眼好處,就是他可以調(diào)用之前的 Flash 2.0 就已經(jīng)融合的Google系工具,比如分析YouTube視頻、輸出內(nèi)容到Docs。這波代碼演示,生成后也直接調(diào)用Colab演示。

以下是2.5 Pro 生成的主播熱度動(dòng)態(tài)演示效果,側(cè)重是代碼到生成的過程,至于內(nèi)容準(zhǔn)確性并沒有體現(xiàn),但整體還可以參考。畢竟2023年的小楊哥還沒出事,還是直播帶貨領(lǐng)域的絕對(duì)一哥。

同時(shí),我們測試了2.5 Pro的深度推理能力,要求其生成一份具身智能報(bào)告。這份報(bào)告不是那種很虛、不能用的內(nèi)容,而是具有一定的可讀性。

OpenAI殺死攝影師

在OpenAI展示的官方案例AI生圖中,第一個(gè)圖就足夠震撼。

如果不明說,恐怕任何人都猜不到,這張圖是AI生成的。畢竟反射畫面和密密麻麻們的文字,都在說AI不可能這么神奇!但實(shí)際上,這就是4o生成的AI圖片,OpenAI放出它的提示詞如下。

這是用手機(jī)拍攝的玻璃白板的廣角圖像,拍攝地點(diǎn)是一間俯瞰海灣大橋的房間。視野中可以看到一位女士正在寫字,她身穿一件印有大型 OpenAI 標(biāo)志的 T 恤。筆跡看起來很自然,但有點(diǎn)凌亂,我們可以看到攝影師的倒影。

更神奇的是第二張圖片轉(zhuǎn)了人物朝向,生成的圖像還是毫無破綻,也放出來震撼下大家。

如果你沒有GPT Plus,那么用GPT免費(fèi)的圖片生成功能,其實(shí)已經(jīng)能秒殺大部分文生圖產(chǎn)品了。這是鯨哥直接用上面同款提示詞生成的圖片。

同時(shí),鯨哥也用Google 2.0 Flash模型,同款提示詞生成了同樣的圖??梢钥吹紾oogle不太有審美,手部細(xì)節(jié)也崩了。

但OpenAI是不是為了官網(wǎng)案例特調(diào),還需要以后全量上線模型,大家長期測試。

另外,4o的圖像生成指令也足夠強(qiáng)大,很多系統(tǒng)在處理約 5-8 個(gè)對(duì)象時(shí)會(huì)遇到困難,而 GPT?4o 可以處理多達(dá) 10-20 個(gè)不同的對(duì)象。

下圖就是4o在同一張圖上,生成了16個(gè)物體,每個(gè)都準(zhǔn)確生成了用戶表達(dá)的內(nèi)容,Amazing!

當(dāng)然,對(duì)于類似Google 2.0 Flash的圖片編輯能力,4o也是不在話下。可謂精準(zhǔn)狙擊了Google剛火出圈的圖片編輯能力。

我們即將接近AGI了嗎?

OpenAI同時(shí)宣布,從今天起,ChatGPT 和 Sora 的所有 Plus、Pro、Team 和 Free 用戶都可以開始使用4o 圖像功能。

山姆奧特曼則表示,“ChatGPT 中圖像的新版本仍在推出中,所以如果今天沒有獲得很好的圖像,請(qǐng)稍后再試 ”。應(yīng)該預(yù)示著將繼續(xù)整合多模態(tài)模型,以及產(chǎn)品端的融合。

有網(wǎng)友評(píng)論,4o圖像功能超越了數(shù)百家AI圖像公司。委實(shí),甚至一些攝像和設(shè)計(jì)師等影像工作的飯碗,也將不保。

而對(duì)于Google來說,Gemini席卷的各種基準(zhǔn)測試,在證明他的強(qiáng)大。

實(shí)際體驗(yàn)中,應(yīng)該快速回答的問題很快回答,需要深度推理的問題也非??焖賵?zhí)行,一份報(bào)告、一份游戲生成基本都在60秒以內(nèi)。

鯨哥驚艷于它的速度,更驚訝這種融合模型帶來的體驗(yàn)。不會(huì)再出現(xiàn)問個(gè)簡單問題,AI也去深度推理了。當(dāng)然,2.5還不能生成圖片,也許下一步3.0,就會(huì)帶來這一能力。

Google這波拉響了硅谷的AI軍備競賽,此前Anthropic CEO稱,還有更強(qiáng)的大模型沒有放出,預(yù)計(jì)也會(huì)近期推出,防止Claude 3.7無法維持領(lǐng)先。

而OpenAI在GPT 4.5發(fā)布會(huì)中,山姆奧特曼都沒有出現(xiàn),也許意味著新的模型也會(huì)近期發(fā)布。

在這場OpenAI和Google對(duì)決的主角戲中,沒想到最著急的是埃隆馬斯克,他在X上發(fā)了多條內(nèi)容,表明Grok是更好的那一個(gè)模型。

馬斯克發(fā)布這張圖時(shí)說道:這是很重要的區(qū)別,嘲諷其他家模型撒謊和追求政治正確,而Grok則追求真理。?馬斯克的出現(xiàn),為今晚這場競爭增添了趣味因素。

就在DeepSeek V3剛剛拿回的頭牌中,Google和OpenAI展示了強(qiáng)大的競爭實(shí)力,而大家在你追我趕中,進(jìn)一步拉近了AGI的夢(mèng)想。

也許就在不遠(yuǎn)的某個(gè)夜晚中,AGI就會(huì)突然降臨!

本文由人人都是產(chǎn)品經(jīng)理作者【鯨選AI】,微信公眾號(hào):【鯨選AI】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖由作者提供

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!
专题
16602人已学习13篇文章
本专题的文章分享了如何做产品运营。
专题
55663人已学习20篇文章
产品上线后冷启动怎么做最有效?这是产品经理和运营必须要了解的。
专题
87951人已学习12篇文章
世间万物皆有套路,面试更是如此,多拿几个靠谱offer。
专题
15275人已学习12篇文章
服务设计在流程性和系统性的问题解决方面提供很好的思路和方法。本专题的文章分享了如何做好服务设计。
专题
13790人已学习12篇文章
为了推动公司业务的正常运转操作,我们需要建立一定的业务模型来推动运作。本专题的文章分享了如何构建业务模型。
专题
12210人已学习12篇文章
瑞幸咖啡和茅台的这次联名合作,无疑让联名营销这类营销方式又掀起了热度。本专题的文章分享了联名营销指南。