精品国产乱码久久久,最新91国内精品

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

GPT-5開發(fā)超18個(gè)月，困難重重或難產(chǎn)？

產(chǎn)業(yè)家

2024-12-30

1 評(píng)論 1424 瀏覽 3 收藏

19 分鐘

本文深入探討了GPT-5項(xiàng)目的最新進(jìn)展，分析了其面臨的困難和挑戰(zhàn)，以及對(duì)整個(gè)人工智能行業(yè)可能產(chǎn)生的影響。

Z Highlights

OpenAI 的 GPT-5 項(xiàng)目研發(fā)進(jìn)度已落后于預(yù)定計(jì)劃，且目前取得的成果尚未充分證明其高昂成本的價(jià)值。該項(xiàng)目已經(jīng)開發(fā)超過(guò) 18 個(gè)月，至少進(jìn)行了兩次大型訓(xùn)練，每次都需要數(shù)月的時(shí)間來(lái)處理大量數(shù)據(jù)。
盡管 GPT-5 的性能據(jù)稱有所提升，但這一進(jìn)步幅度并未足以證明維持其運(yùn)行所需的高額成本是合理的。為期 6 個(gè)月的訓(xùn)練，單單計(jì)算成本就可能要花費(fèi)約5億美元。
OpenAI 面臨著內(nèi)部動(dòng)蕩和競(jìng)爭(zhēng)對(duì)手幾乎不斷試圖挖走其頂尖研究人員的問(wèn)題，有時(shí)甚至提供數(shù)百萬(wàn)美元的報(bào)酬。
在 Orion 的掙扎中，OpenAI 研究人員找到了讓 LLM 更聰明的新方法：推理。研究人員表示，花費(fèi)很長(zhǎng)時(shí)間“思考”可以讓 LLMs 解決他們未經(jīng)過(guò)訓(xùn)練的困難問(wèn)題。

據(jù) The Wall Street Journal 報(bào)道，OpenAI 的新人工智能項(xiàng)目進(jìn)度滯后，費(fèi)用巨大。目前尚不清楚何時(shí)——或者是否——能夠成功。世界上可能沒(méi)有足夠的數(shù)據(jù)使其足夠智能。

該項(xiàng)目正式名稱為 GPT-5，代號(hào)為 Orion，已經(jīng)開發(fā)超過(guò) 18 個(gè)月，旨在成為推動(dòng) ChatGPT 技術(shù)的重大進(jìn)步。知情人士表示，OpenAI 最親密的合作伙伴和最大投資者微軟，原本預(yù)計(jì)在 2024 年中期看到新模型。

OpenAI 至少進(jìn)行了兩次大型訓(xùn)練，每次都需要數(shù)月的時(shí)間來(lái)處理大量數(shù)據(jù)，目的是讓 Orion 更聰明。項(xiàng)目相關(guān)人士表示，每次都會(huì)出現(xiàn)新問(wèn)題，軟件未能達(dá)到研究人員所期望的結(jié)果。

他們說(shuō)，最好的情況下，Orion 的表現(xiàn)優(yōu)于 OpenAI 目前的產(chǎn)品，但尚未進(jìn)步到足以證明維持新模型運(yùn)行的巨大成本。根據(jù)對(duì)訓(xùn)練各個(gè)方面的公開和私有估計(jì)，六個(gè)月的訓(xùn)練運(yùn)行僅計(jì)算成本就可能花費(fèi)約五億美元。

OpenAI 及其大膽的首席執(zhí)行官山姆·奧特曼在兩年前推出 ChatGPT 時(shí)震動(dòng)了硅谷。人工智能承諾將不斷展現(xiàn)出戲劇性的進(jìn)步，并滲透到我們生活的幾乎所有方面。分析師預(yù)測(cè)，科技巨頭在未來(lái)幾年可能會(huì)在人工智能項(xiàng)目上花費(fèi) 1 萬(wàn)億美元。

這些期望的重?fù)?dān)主要落在 OpenAI 身上，這家公司位于人工智能繁榮的中心。

投資者在十月份給予 OpenAI 的 1570 億美元估值在很大程度上基于奧特曼的預(yù)測(cè)，即 GPT-5 將在各種主題和任務(wù)中代表一個(gè)“顯著的飛躍”。

GPT-5 應(yīng)該能夠解鎖新的科學(xué)發(fā)現(xiàn)，并完成日常人類任務(wù)，如預(yù)訂約會(huì)或航班。研究人員希望它能比今天的人工智能犯更少的錯(cuò)誤，或者至少承認(rèn)不確定性——這是當(dāng)前模型面臨的挑戰(zhàn)，因?yàn)樗鼈兛梢砸悦黠@的自信產(chǎn)生錯(cuò)誤，這被稱為幻覺。

AI 聊天機(jī)器人運(yùn)行在稱為大型語(yǔ)言模型的基礎(chǔ)技術(shù)上，或稱為 LLM。消費(fèi)者、企業(yè)和政府已經(jīng)依賴它們來(lái)處理從編寫計(jì)算機(jī)代碼到美化營(yíng)銷文案和策劃派對(duì)的所有事務(wù)。OpenAI 的模型稱為 GPT-4，這是該公司自 2015 年成立以來(lái)開發(fā)的第四個(gè) LLM。

雖然 GPT-4 表現(xiàn)得像一個(gè)聰明的高中生，但前 OpenAI 高管表示，最終的 GPT-5 在某些任務(wù)上實(shí)際上會(huì)像博士生。今年早些時(shí)候，奧特曼在斯坦福大學(xué)的一次演講中告訴學(xué)生，OpenAI 可以“以很高的科學(xué)確定性”說(shuō) GPT-5 將比當(dāng)前模型聰明得多。

沒(méi)有設(shè)定的標(biāo)準(zhǔn)來(lái)確定何時(shí)一個(gè)模型足夠智能，可以被稱為 GPT-5。OpenAI 可以在數(shù)學(xué)和編碼等領(lǐng)域測(cè)試其LLMs。是否將該模型稱為 GPT-5，主要取決于公司高管的直覺，或者正如許多技術(shù)專家所說(shuō)的，“氛圍”。

到目前為止，氣氛不對(duì)。

OpenAI 和微軟拒絕對(duì)此文章發(fā)表評(píng)論。奧特曼在 11 月表示，該初創(chuàng)公司不會(huì)在 2024 年發(fā)布任何名為 GPT-5 的產(chǎn)品。

一、訓(xùn)練日

從GPT-4 在 2023 年 3 月發(fā)布的那一刻起，OpenAI 就一直在開發(fā) GPT-5。

長(zhǎng)期從事人工智能研究的學(xué)者表示，開發(fā)像LLMs這樣的系統(tǒng)既是一門藝術(shù)，也是一門科學(xué)。世界上最受尊敬的人工智能科學(xué)家因其對(duì)如何獲得更好結(jié)果的直覺而受到贊譽(yù)。

模型在訓(xùn)練過(guò)程中進(jìn)行測(cè)試，這是一個(gè)持續(xù)的時(shí)期，模型可以接收數(shù)萬(wàn)億個(gè)稱為標(biāo)記的詞片段。一次大型訓(xùn)練可能需要幾個(gè)月的時(shí)間，在一個(gè)擁有數(shù)萬(wàn)個(gè)昂貴且受歡迎的計(jì)算機(jī)芯片的數(shù)據(jù)中心進(jìn)行，通常來(lái)自Nvidia。

在一次訓(xùn)練過(guò)程中，研究人員在電腦前彎腰工作數(shù)周甚至數(shù)月，試圖將世界上大部分知識(shí)輸入到一個(gè)人工智能系統(tǒng)中，使用一些最昂貴的硬件在遙遠(yuǎn)的數(shù)據(jù)中心。

奧特曼表示，訓(xùn)練 GPT-4 的成本超過(guò) 1 億美元。未來(lái)的人工智能模型預(yù)計(jì)將超過(guò) 10 億美元。一次失敗的訓(xùn)練就像一枚火箭在發(fā)射后不久在天空中爆炸。

研究人員通過(guò)在較小的規(guī)模上進(jìn)行實(shí)驗(yàn)來(lái)盡量減少這種失敗的可能性——在真正的實(shí)驗(yàn)之前進(jìn)行試運(yùn)行。

從一開始，GPT-5 的計(jì)劃就存在問(wèn)題。

在 2023 年中，OpenAI 開始了一次訓(xùn)練運(yùn)行，同時(shí)也是對(duì) Orion 提議的新設(shè)計(jì)的測(cè)試。但這個(gè)過(guò)程進(jìn)展緩慢，表明更大規(guī)模的訓(xùn)練運(yùn)行可能需要非常長(zhǎng)的時(shí)間，這反過(guò)來(lái)又會(huì)使其變得極其昂貴。而這個(gè)名為 Arrakis 的項(xiàng)目的結(jié)果表明，創(chuàng)建 GPT-5 的過(guò)程不會(huì)像預(yù)期的那樣順利。

OpenAI 研究人員決定對(duì) Orion 進(jìn)行一些技術(shù)調(diào)整以增強(qiáng)其性能。他們還得出結(jié)論，認(rèn)為需要更多多樣化的高質(zhì)量數(shù)據(jù)。他們覺得公共互聯(lián)網(wǎng)的數(shù)據(jù)不足。

通常，人工智能模型在處理的數(shù)據(jù)越多，其能力就越強(qiáng)。對(duì)于LLMs來(lái)說(shuō)，這些數(shù)據(jù)主要來(lái)自書籍、學(xué)術(shù)出版物和其他受人尊敬的來(lái)源。這些材料幫助LLMs更清晰地表達(dá)自己，并處理各種任務(wù)。

對(duì)于其之前的模型，OpenAI 使用了從互聯(lián)網(wǎng)抓取的數(shù)據(jù)：新聞文章、社交媒體帖子和科學(xué)論文。

為了讓 Orion 更智能，OpenAI 需要讓它更大。這意味著它需要更多的數(shù)據(jù)，但目前還不夠。

“這變得非常昂貴，并且很難找到更多同等高質(zhì)量的數(shù)據(jù)，”DatologyAI 的首席執(zhí)行官 Ari Morcos 說(shuō)，該初創(chuàng)公司開發(fā)工具以改善數(shù)據(jù)選擇。Morcos 正在用更少但更好的數(shù)據(jù)構(gòu)建模型，他認(rèn)為這種方法將使今天的人工智能系統(tǒng)比所有頂級(jí)人工智能公司（如 OpenAI）所采用的策略更具能力。

OpenAI 的解決方案是從零開始創(chuàng)建數(shù)據(jù)。

它正在招聘人員為 Orion 編寫新的軟件代碼或解決數(shù)學(xué)問(wèn)題以供學(xué)習(xí)。這些工人中有些是軟件工程師和數(shù)學(xué)家，他們還與 Orion 分享他們工作的解釋。

許多研究人員認(rèn)為，代碼，軟件的語(yǔ)言，可以幫助LLMs解決它們尚未見過(guò)的問(wèn)題。

讓人們解釋他們的思考加深了新創(chuàng)建數(shù)據(jù)的價(jià)值。這為L(zhǎng)LM提供了更多的語(yǔ)言輸入；這也是模型未來(lái)如何解決類似問(wèn)題的地圖。

“我們正在將人類智慧從人類思維轉(zhuǎn)移到機(jī)器思維中，”Turing 的首席執(zhí)行官兼聯(lián)合創(chuàng)始人喬納森·西達(dá)特說(shuō)。Turing 是一家與 OpenAI、Meta等公司合作的人工智能基礎(chǔ)設(shè)施公司。

在人工智能訓(xùn)練中，Turing 高管表示，軟件工程師可能會(huì)被要求編寫一個(gè)有效解決復(fù)雜邏輯問(wèn)題的程序。數(shù)學(xué)家可能需要計(jì)算由一百萬(wàn)個(gè)籃球構(gòu)成的金字塔的最大高度的答案——更重要的是，如何得出這些答案——然后被納入人工智能訓(xùn)練材料中。

OpenAI 與理論物理等領(lǐng)域的專家合作，解釋他們將如何解決該領(lǐng)域一些最棘手的問(wèn)題。這也可以幫助 Orion 變得更聰明。

這個(gè)過(guò)程非常緩慢。GPT-4 的訓(xùn)練數(shù)據(jù)估計(jì)為 13 萬(wàn)億個(gè)標(biāo)記。1000 人每天寫 5000 個(gè)單詞需要幾個(gè)月才能產(chǎn)生 10 億個(gè)標(biāo)記。

OpenAI 還開始開發(fā)被稱為合成數(shù)據(jù)的數(shù)據(jù)，即由 AI 創(chuàng)建的數(shù)據(jù)，以幫助訓(xùn)練 Orion。研究表明，AI 為 AI 創(chuàng)建數(shù)據(jù)的反饋循環(huán)往往會(huì)導(dǎo)致故障或產(chǎn)生無(wú)意義的答案。

OpenAI 的科學(xué)家認(rèn)為，他們可以通過(guò)使用其另一個(gè) AI 模型生成的數(shù)據(jù)來(lái)避免這些問(wèn)題，該模型稱為 o1，知情人士表示。

OpenAI 原本就困難的任務(wù)因內(nèi)部動(dòng)蕩和競(jìng)爭(zhēng)對(duì)手幾乎不斷試圖挖走其頂尖研究人員而變得更加復(fù)雜，有時(shí)甚至提供數(shù)百萬(wàn)美元的報(bào)酬。

去年，奧特曼被 OpenAI 的董事會(huì)突然解雇，一些研究人員擔(dān)心公司是否會(huì)繼續(xù)運(yùn)營(yíng)。奧特曼很快被重新任命為首席執(zhí)行官，并著手改革 OpenAI 的治理結(jié)構(gòu)。

今年已有超過(guò)二十位關(guān)鍵高管、研究人員和長(zhǎng)期員工離開了 OpenAI，包括聯(lián)合創(chuàng)始人兼首席科學(xué)家伊利亞·蘇茨凱弗和首席技術(shù)官米拉·穆拉提。上周四，廣受尊敬的研究人員亞歷克·拉德福德宣布離職，他在 OpenAI 工作了大約八年，并擔(dān)任多篇科學(xué)論文的首席作者。

二、重啟

到 2024 年初，管理層開始感受到壓力。GPT-4 已經(jīng)發(fā)布一年，競(jìng)爭(zhēng)對(duì)手開始迎頭趕上。來(lái)自 Anthropic 的一款新LLM被業(yè)內(nèi)許多人評(píng)為優(yōu)于 GPT-4。幾個(gè)月后，谷歌推出了今年最具病毒傳播性的 AI 應(yīng)用，名為 NotebookLM。

隨著 Orion 的停滯，OpenAI 開始開發(fā)其他項(xiàng)目和應(yīng)用程序。它們包括精簡(jiǎn)版的 GPT-4 和 Sora，一個(gè)可以生成 AI 視頻的產(chǎn)品。

這導(dǎo)致了在新產(chǎn)品開發(fā)團(tuán)隊(duì)和 Orion 研究人員之間對(duì)有限計(jì)算資源的爭(zhēng)奪，知情人士表示。

人工智能實(shí)驗(yàn)室之間的競(jìng)爭(zhēng)變得如此激烈，以至于主要科技公司發(fā)布的關(guān)于最新發(fā)現(xiàn)或突破的論文比科學(xué)界的典型數(shù)量要少。兩年前，隨著資金涌入市場(chǎng)，科技公司開始將這些研究成果視為需要保護(hù)的商業(yè)機(jī)密。一些研究人員對(duì)此非常認(rèn)真，他們不愿在飛機(jī)、咖啡店或任何可能有人從旁邊窺視他們工作的地方工作。

這種保密的態(tài)度讓許多長(zhǎng)期從事人工智能研究的人感到沮喪，包括 Meta 的首席人工智能科學(xué)家 Yann LeCun。LeCun 表示，OpenAI 和 Anthropic 的工作不應(yīng)再被視為研究，而應(yīng)被視為“高級(jí)產(chǎn)品開發(fā)”。

“如果你在商業(yè)時(shí)鐘上進(jìn)行這項(xiàng)工作，那就不叫研究，”LeCun 在最近的一次 AI 會(huì)議上說(shuō)，當(dāng)時(shí) OpenAI 的參與很少?！叭绻阍诿孛苤羞M(jìn)行，那就不叫研究?！?/p>

在 2024 年初，OpenAI 準(zhǔn)備再次嘗試 Orion，這次配備了更好的數(shù)據(jù)。研究人員在年初的幾個(gè)月內(nèi)進(jìn)行了幾次小規(guī)模的訓(xùn)練，以增強(qiáng)信心。

到五月，OpenAI 的研究人員決定他們準(zhǔn)備好進(jìn)行另一次大規(guī)模的 Orion 訓(xùn)練，這次訓(xùn)練預(yù)計(jì)將持續(xù)到十一月。

一旦訓(xùn)練開始，研究人員發(fā)現(xiàn)數(shù)據(jù)存在一個(gè)問(wèn)題：它并不像他們想象的那樣多樣化，這可能限制了 Orion 的學(xué)習(xí)能力。

這個(gè)問(wèn)題在小規(guī)模的努力中并不明顯，只有在大型訓(xùn)練運(yùn)行開始后才變得明顯。OpenAI 已經(jīng)花費(fèi)了太多時(shí)間和金錢，無(wú)法重新開始。

相反，研究人員急忙尋找更廣泛的數(shù)據(jù)來(lái)在訓(xùn)練過(guò)程中為模型提供支持。目前尚不清楚這一策略是否有效。

Orion 的問(wèn)題向 OpenAI 的一些人發(fā)出了信號(hào)，表明曾推動(dòng)其早期成功的“更多即是更多”策略正在失去動(dòng)力。

OpenAI 并不是唯一一家擔(dān)心進(jìn)展遇到瓶頸的公司。在整個(gè)行業(yè)中，關(guān)于人工智能的改進(jìn)是否開始停滯的辯論正在激烈進(jìn)行。

Ilya Sutskever 最近共同創(chuàng)辦了一家名為安全超級(jí)智能（SSI）的新人工智能公司，他在最近的一次人工智能會(huì)議上宣稱，最大數(shù)據(jù)時(shí)代已經(jīng)結(jié)束?！皵?shù)據(jù)沒(méi)有增長(zhǎng)，因?yàn)槲覀冎挥幸粋€(gè)互聯(lián)網(wǎng)，”他對(duì)一群研究人員、政策專家和科學(xué)家說(shuō)?！澳闵踔量梢哉f(shuō)數(shù)據(jù)是人工智能的化石燃料?！?/p>

而那燃料開始耗盡了。

三、推理

他們?cè)?Orion 的掙扎使 OpenAI 研究人員找到了讓LLM更聰明的新方法：推理。研究人員表示，花費(fèi)很長(zhǎng)時(shí)間“思考”可以讓LLMs解決他們未經(jīng)過(guò)訓(xùn)練的困難問(wèn)題。

在幕后，OpenAI 的 o1 為每個(gè)問(wèn)題提供多個(gè)回答，并分析它們以找到最佳答案。它可以執(zhí)行更復(fù)雜的任務(wù)，比如撰寫商業(yè)計(jì)劃或創(chuàng)建填字游戲，同時(shí)解釋其推理過(guò)程——這有助于模型從每個(gè)答案中學(xué)習(xí)一點(diǎn)。

蘋果的研究人員最近發(fā)布了一篇論文，認(rèn)為推理模型，包括 o1 的版本，很可能是在模仿它們?cè)谟?xùn)練中看到的數(shù)據(jù)，而不是實(shí)際解決新問(wèn)題。

蘋果研究人員表示，如果問(wèn)題被更改為包含無(wú)關(guān)細(xì)節(jié)——例如將關(guān)于獼猴桃的數(shù)學(xué)問(wèn)題調(diào)整為提到一些水果比其他水果小，他們發(fā)現(xiàn)“災(zāi)難性的性能下降”。

在九月份，OpenAI 推出了其 o1 推理模型的預(yù)覽，并在本月早些時(shí)候發(fā)布了 o1 的完整版本。

所有這些額外的腦力成本很高。OpenAI 現(xiàn)在支付費(fèi)用以生成對(duì)單個(gè)查詢的多個(gè)答案，而不僅僅是一個(gè)。

在一次最近的 TED 演講中，OpenAI 的一位高級(jí)研究科學(xué)家強(qiáng)調(diào)了推理的優(yōu)勢(shì)。

“結(jié)果發(fā)現(xiàn)，讓機(jī)器人在一手撲克中思考 20 秒，獲得的性能提升與將模型規(guī)模擴(kuò)大 100,000 倍并訓(xùn)練 100,000 倍的時(shí)間相同，”O(jiān)penAI 科學(xué)家諾姆·布朗說(shuō)道。

一個(gè)更先進(jìn)和高效的推理模型可以構(gòu)成 Orion 的基礎(chǔ)。OpenAI 的研究人員正在追求這種方法，并希望將其與舊的方法結(jié)合起來(lái)，即更多的數(shù)據(jù)，其中一些數(shù)據(jù)可能來(lái)自 OpenAI 的其他 AI 模型。然后，OpenAI 可以用人類生成的材料來(lái)完善結(jié)果。

在星期五，奧特曼宣布了一種新的推理模型的計(jì)劃，這種模型比公司之前發(fā)布的任何模型都要智能。他沒(méi)有提到何時(shí)或是否會(huì)推出一個(gè)值得稱為 GPT-5 的模型。

來(lái)源 | Z Potentials

本文翻譯自：WSJ, https://www.wsj.com/tech/ai/openai-gpt5-orion-delays-639e7693?st=ng5hBi&reflink=desktopwebshare_permalink

編譯：ChatGPT

本文由人人都是產(chǎn)品經(jīng)理作者【產(chǎn)業(yè)家】，微信公眾號(hào)：【產(chǎn)業(yè)家】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App