18禁止观看强奷免费视频网站,国产精品无码不卡系列在线

<sub id="cei7k"></sub>

<th id="cei7k"><style id="cei7k"></style></th>

<center id="cei7k"><ins id="cei7k"><noframes id="cei7k"></noframes></ins></center>

<mark id="cei7k"><kbd id="cei7k"><small id="cei7k"></small></kbd></mark>

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

{{ userInfo.member ? '查看權(quán)益' : '開通會(huì)員' }}

發(fā)布

注冊(cè) | 登錄

OpenAI附議Ilya預(yù)訓(xùn)練終結(jié)！“但Scaling Law還沒死”

量子位

2024-12-16

0 評(píng)論 318 瀏覽 0 收藏

8 分鐘

在人工智能領(lǐng)域，預(yù)訓(xùn)練模型和Scaling Law一直是研究和討論的熱點(diǎn)。本文將帶您深入了解在最近NeurIPS會(huì)議上關(guān)于這一主題的最新討論，特別是OpenAI核心成員Noam Brown對(duì)于預(yù)訓(xùn)練終結(jié)和Scaling Law未來發(fā)展的看法。

Is Scaling is All you Need？

在Ilya探討完「預(yù)訓(xùn)練即將終結(jié)」之后，關(guān)于Scaling Law的討論再次引發(fā)熱議。

這屆NeurIPS將被銘記成預(yù)訓(xùn)練終結(jié)的一屆會(huì)議

在最新研討會(huì)上，OpenAI大神，o1核心成員Noam Brown表示，o1代表的是一種全新的，以推理計(jì)算為代表的Scaling。

網(wǎng)友們表示：好好好，Scaling Law還沒有死！Scaling Law還在繼續(xù)。

演講實(shí)錄：Is Scaling is All you Need？

Noam Brown，OpenAI大神一枚，去年7月從Meta離職，曾開發(fā)首個(gè)在戰(zhàn)略游戲中達(dá)到人類水平的AI，此前在游戲AI領(lǐng)域相關(guān)研究成果曾登上Science封面。

如今在OpenAI致力于多步推理、自我博弈以及多智能體AI相關(guān)的研究。

此前在o1發(fā)布的直播時(shí)候露過面。

據(jù)網(wǎng)友@swyx分享，Noam Brown首先談到Scaling Law的過去演進(jìn)。

AI從2019年到現(xiàn)在，GPT-2演進(jìn)到GPT-4，這難以置信的成就都來自于數(shù)據(jù)和算力規(guī)模的擴(kuò)大。

但大語言模型仍然無法解決像井字棋這樣的簡(jiǎn)單問題，

那么隨之而來的一個(gè)問題是，Is Scaling is All you Need？我們真的還需要再消耗更高的成本來訓(xùn)練更好的AI嗎？

這當(dāng)中被低估的其實(shí)是推理的成本，它在過去的擴(kuò)展（Scaling）要少得多。o1帶來了Scaling的新的維度。

隨后，他追溯了過去模型展現(xiàn)出來的類似規(guī)律。

比如在2012年-2015年間撲克模型的擴(kuò)展。模型規(guī)模每年擴(kuò)展5倍，但收效不大。但依照「人類需要更長(zhǎng)時(shí)間思考更難問題」這一見解，增加了模型20 秒的搜索時(shí)間，效果大致相當(dāng)于將模型規(guī)模擴(kuò)大了100000倍。

還有在棋牌中擴(kuò)展推理的歷史，backgammon- 國(guó)際象棋 – 圍棋。AlphaGo Zero在原始NN基礎(chǔ)上實(shí)現(xiàn)了從3000到5200 Elo增長(zhǎng)，都是因?yàn)閠est-time search（推理時(shí)間搜索）。

此外，他還引用了Andy L.Jones關(guān)于Scaling Laws of games的圖表——可以用10倍的預(yù)訓(xùn)練計(jì)算量換取15倍的測(cè)試時(shí)間計(jì)算量。

如果游戲結(jié)果擴(kuò)展到 LLMs，是不是也會(huì)是如此？

那么關(guān)于o1接下來，會(huì)有更高的推理計(jì)算能力。在過去 5 年里，LLM概念就是聊天機(jī)器人。那么他們可以做得更好”

最后他還打了個(gè)小廣告，目前他的多智能體團(tuán)隊(duì)還在招人ing。

網(wǎng)友評(píng)論

如果再結(jié)合昨天Ilya談到「預(yù)訓(xùn)練時(shí)代即將終結(jié)」。那么對(duì)于市場(chǎng)來說，這一波可不是利好英偉達(dá)了（Doge）。

不過也有從業(yè)者站出來反對(duì)他的看法：推理時(shí)間計(jì)算（Inference Time Computation）并不新鮮，本來還想把它去掉，但出于需要又讓它回來了。

他還糾正說，里面關(guān)于諸多游戲時(shí)間順序是錯(cuò)誤的，許多游戲（包括國(guó)際象棋和圍棋）一開始都只專注于推理時(shí)間計(jì)算。但后來大家都傾向于離線學(xué)習(xí)策略，這樣省去了大量的在線計(jì)算時(shí)間。

因此，減少面向用戶的推理時(shí)間計(jì)算是一個(gè)深思熟慮的選擇，甚至導(dǎo)致該領(lǐng)域開始改變對(duì)計(jì)算復(fù)雜性考慮的方式。

這一趨勢(shì)在 LLMs 中也得到了延續(xù)——所有的重點(diǎn)都放在預(yù)訓(xùn)練上，因此推理時(shí)間的計(jì)算量可以忽略不計(jì)。這樣對(duì)終端用戶來說成本極低，甚至可以在本地的邊緣設(shè)備上完成。

Ilya在談到未來超級(jí)智能的暢想時(shí)，也提及了當(dāng)前推理的不可預(yù)測(cè)性：

推理越多，系統(tǒng)變得越不可預(yù)測(cè)，這一點(diǎn)在一些復(fù)雜任務(wù)中表現(xiàn)得尤為突出。

他還提到：

目前的AI系統(tǒng)還不能真正理解和推理，雖然它們能模擬人類的直覺，但未來的AI將會(huì)在推理和決策方面展現(xiàn)出更加不可預(yù)測(cè)的能力。

不過大模型到底會(huì)朝著哪些能力上擴(kuò)展，這個(gè)還得看這些科學(xué)家們持續(xù)探索。

One More Thing

本來啊，從現(xiàn)場(chǎng)repo來看，這本來是個(gè)關(guān)于數(shù)學(xué)AI的研討會(huì)，硬生生地被他弄成了討論大模型推理Scaling Law。

現(xiàn)場(chǎng)也是人很多，據(jù)說門口都還有20多個(gè)人在排隊(duì)等待。當(dāng)然也有部分原因是房間太小了。

參考鏈接：

[1]https://x.com/swyx/status/1867990396762243324

[2]https://x.com/e__honig/status/1868002417045840243

[3]https://x.com/drapersgulld/status/1868023022390485052

白交發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI

本文由人人都是產(chǎn)品經(jīng)理作者【量子位】，微信公眾號(hào)：【量子位】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App

量子位

追蹤人工智能新趨勢(shì)，關(guān)注科技行業(yè)新突破

69篇作品 181919總閱讀量

以小鵝通為例，探討SaaS產(chǎn)品如何解決“上手難、效率低”的用戶體驗(yàn)問題

03-175043 瀏覽

以小鵝通為例，探討SaaS產(chǎn)品如何解決“上手難、效率低”的用戶體驗(yàn)問題

私域一年GMV超2000萬，穩(wěn)居行業(yè)前三的杰士邦，它的私域好在哪？

03-065244 瀏覽

私域一年GMV超2000萬，穩(wěn)居行業(yè)前三的杰士邦，它的私域好在哪？

美團(tuán)入“港”，能講出新故事嗎？

05-241678 瀏覽

美團(tuán)入“港”，能講出新故事嗎？

露營(yíng)，春天在哪里？

04-183293 瀏覽

露營(yíng)，春天在哪里？

賣點(diǎn)提煉方法論：以新品上市策略為例

02-034188 瀏覽

賣點(diǎn)提煉方法論：以新品上市策略為例

評(píng)論

目前還沒評(píng)論，等你發(fā)揮！

100個(gè)關(guān)鍵詞預(yù)測(cè)2023年 | 美妝篇（51-60）：適應(yīng)原、防脫和皮膚循環(huán)

03-094236 瀏覽
結(jié)構(gòu)化分析，為什么中國(guó)互聯(lián)網(wǎng)的鄰里先驅(qū)者失敗了？

11-303752 瀏覽
抖音測(cè)試付費(fèi)短視頻，隔壁B站饞哭了

11-203120 瀏覽