GPT-5開發(fā)超18個(gè)月,困難重重或難產(chǎn)?
本文深入探討了GPT-5項(xiàng)目的最新進(jìn)展,分析了其面臨的困難和挑戰(zhàn),以及對(duì)整個(gè)人工智能行業(yè)可能產(chǎn)生的影響。
Z Highlights
- OpenAI 的 GPT-5 項(xiàng)目研發(fā)進(jìn)度已落后于預(yù)定計(jì)劃,且目前取得的成果尚未充分證明其高昂成本的價(jià)值。該項(xiàng)目已經(jīng)開發(fā)超過(guò) 18 個(gè)月,至少進(jìn)行了兩次大型訓(xùn)練,每次都需要數(shù)月的時(shí)間來(lái)處理大量數(shù)據(jù)。
- 盡管 GPT-5 的性能據(jù)稱有所提升,但這一進(jìn)步幅度并未足以證明維持其運(yùn)行所需的高額成本是合理的。為期 6 個(gè)月的訓(xùn)練,單單計(jì)算成本就可能要花費(fèi)約5億美元。
- OpenAI 面臨著內(nèi)部動(dòng)蕩和競(jìng)爭(zhēng)對(duì)手幾乎不斷試圖挖走其頂尖研究人員的問(wèn)題,有時(shí)甚至提供數(shù)百萬(wàn)美元的報(bào)酬。
- 在 Orion 的掙扎中,OpenAI 研究人員找到了讓 LLM 更聰明的新方法:推理。研究人員表示,花費(fèi)很長(zhǎng)時(shí)間“思考”可以讓 LLMs 解決他們未經(jīng)過(guò)訓(xùn)練的困難問(wèn)題。
據(jù) The Wall Street Journal 報(bào)道,OpenAI 的新人工智能項(xiàng)目進(jìn)度滯后,費(fèi)用巨大。目前尚不清楚何時(shí)——或者是否——能夠成功。世界上可能沒(méi)有足夠的數(shù)據(jù)使其足夠智能。
該項(xiàng)目正式名稱為 GPT-5,代號(hào)為 Orion,已經(jīng)開發(fā)超過(guò) 18 個(gè)月,旨在成為推動(dòng) ChatGPT 技術(shù)的重大進(jìn)步。知情人士表示,OpenAI 最親密的合作伙伴和最大投資者微軟,原本預(yù)計(jì)在 2024 年中期看到新模型。
OpenAI 至少進(jìn)行了兩次大型訓(xùn)練,每次都需要數(shù)月的時(shí)間來(lái)處理大量數(shù)據(jù),目的是讓 Orion 更聰明。項(xiàng)目相關(guān)人士表示,每次都會(huì)出現(xiàn)新問(wèn)題,軟件未能達(dá)到研究人員所期望的結(jié)果。
他們說(shuō),最好的情況下,Orion 的表現(xiàn)優(yōu)于 OpenAI 目前的產(chǎn)品,但尚未進(jìn)步到足以證明維持新模型運(yùn)行的巨大成本。根據(jù)對(duì)訓(xùn)練各個(gè)方面的公開和私有估計(jì),六個(gè)月的訓(xùn)練運(yùn)行僅計(jì)算成本就可能花費(fèi)約五億美元。
OpenAI 及其大膽的首席執(zhí)行官山姆·奧特曼在兩年前推出 ChatGPT 時(shí)震動(dòng)了硅谷。人工智能承諾將不斷展現(xiàn)出戲劇性的進(jìn)步,并滲透到我們生活的幾乎所有方面。分析師預(yù)測(cè),科技巨頭在未來(lái)幾年可能會(huì)在人工智能項(xiàng)目上花費(fèi) 1 萬(wàn)億美元。
這些期望的重?fù)?dān)主要落在 OpenAI 身上,這家公司位于人工智能繁榮的中心。
投資者在十月份給予 OpenAI 的 1570 億美元估值在很大程度上基于奧特曼的預(yù)測(cè),即 GPT-5 將在各種主題和任務(wù)中代表一個(gè)“顯著的飛躍”。
GPT-5 應(yīng)該能夠解鎖新的科學(xué)發(fā)現(xiàn),并完成日常人類任務(wù),如預(yù)訂約會(huì)或航班。研究人員希望它能比今天的人工智能犯更少的錯(cuò)誤,或者至少承認(rèn)不確定性——這是當(dāng)前模型面臨的挑戰(zhàn),因?yàn)樗鼈兛梢砸悦黠@的自信產(chǎn)生錯(cuò)誤,這被稱為幻覺。
AI 聊天機(jī)器人運(yùn)行在稱為大型語(yǔ)言模型的基礎(chǔ)技術(shù)上,或稱為 LLM。消費(fèi)者、企業(yè)和政府已經(jīng)依賴它們來(lái)處理從編寫計(jì)算機(jī)代碼到美化營(yíng)銷文案和策劃派對(duì)的所有事務(wù)。OpenAI 的模型稱為 GPT-4,這是該公司自 2015 年成立以來(lái)開發(fā)的第四個(gè) LLM。
雖然 GPT-4 表現(xiàn)得像一個(gè)聰明的高中生,但前 OpenAI 高管表示,最終的 GPT-5 在某些任務(wù)上實(shí)際上會(huì)像博士生。今年早些時(shí)候,奧特曼在斯坦福大學(xué)的一次演講中告訴學(xué)生,OpenAI 可以“以很高的科學(xué)確定性”說(shuō) GPT-5 將比當(dāng)前模型聰明得多。
沒(méi)有設(shè)定的標(biāo)準(zhǔn)來(lái)確定何時(shí)一個(gè)模型足夠智能,可以被稱為 GPT-5。OpenAI 可以在數(shù)學(xué)和編碼等領(lǐng)域測(cè)試其LLMs。是否將該模型稱為 GPT-5,主要取決于公司高管的直覺,或者正如許多技術(shù)專家所說(shuō)的,“氛圍”。
到目前為止,氣氛不對(duì)。
OpenAI 和微軟拒絕對(duì)此文章發(fā)表評(píng)論。奧特曼在 11 月表示,該初創(chuàng)公司不會(huì)在 2024 年發(fā)布任何名為 GPT-5 的產(chǎn)品。
一、訓(xùn)練日
從GPT-4 在 2023 年 3 月發(fā)布的那一刻起,OpenAI 就一直在開發(fā) GPT-5。
長(zhǎng)期從事人工智能研究的學(xué)者表示,開發(fā)像LLMs這樣的系統(tǒng)既是一門藝術(shù),也是一門科學(xué)。世界上最受尊敬的人工智能科學(xué)家因其對(duì)如何獲得更好結(jié)果的直覺而受到贊譽(yù)。
模型在訓(xùn)練過(guò)程中進(jìn)行測(cè)試,這是一個(gè)持續(xù)的時(shí)期,模型可以接收數(shù)萬(wàn)億個(gè)稱為標(biāo)記的詞片段。一次大型訓(xùn)練可能需要幾個(gè)月的時(shí)間,在一個(gè)擁有數(shù)萬(wàn)個(gè)昂貴且受歡迎的計(jì)算機(jī)芯片的數(shù)據(jù)中心進(jìn)行,通常來(lái)自Nvidia。
在一次訓(xùn)練過(guò)程中,研究人員在電腦前彎腰工作數(shù)周甚至數(shù)月,試圖將世界上大部分知識(shí)輸入到一個(gè)人工智能系統(tǒng)中,使用一些最昂貴的硬件在遙遠(yuǎn)的數(shù)據(jù)中心。
奧特曼表示,訓(xùn)練 GPT-4 的成本超過(guò) 1 億美元。未來(lái)的人工智能模型預(yù)計(jì)將超過(guò) 10 億美元。一次失敗的訓(xùn)練就像一枚火箭在發(fā)射后不久在天空中爆炸。
研究人員通過(guò)在較小的規(guī)模上進(jìn)行實(shí)驗(yàn)來(lái)盡量減少這種失敗的可能性——在真正的實(shí)驗(yàn)之前進(jìn)行試運(yùn)行。
從一開始,GPT-5 的計(jì)劃就存在問(wèn)題。
在 2023 年中,OpenAI 開始了一次訓(xùn)練運(yùn)行,同時(shí)也是對(duì) Orion 提議的新設(shè)計(jì)的測(cè)試。但這個(gè)過(guò)程進(jìn)展緩慢,表明更大規(guī)模的訓(xùn)練運(yùn)行可能需要非常長(zhǎng)的時(shí)間,這反過(guò)來(lái)又會(huì)使其變得極其昂貴。而這個(gè)名為 Arrakis 的項(xiàng)目的結(jié)果表明,創(chuàng)建 GPT-5 的過(guò)程不會(huì)像預(yù)期的那樣順利。
OpenAI 研究人員決定對(duì) Orion 進(jìn)行一些技術(shù)調(diào)整以增強(qiáng)其性能。他們還得出結(jié)論,認(rèn)為需要更多多樣化的高質(zhì)量數(shù)據(jù)。他們覺得公共互聯(lián)網(wǎng)的數(shù)據(jù)不足。
通常,人工智能模型在處理的數(shù)據(jù)越多,其能力就越強(qiáng)。對(duì)于LLMs來(lái)說(shuō),這些數(shù)據(jù)主要來(lái)自書籍、學(xué)術(shù)出版物和其他受人尊敬的來(lái)源。這些材料幫助LLMs更清晰地表達(dá)自己,并處理各種任務(wù)。
對(duì)于其之前的模型,OpenAI 使用了從互聯(lián)網(wǎng)抓取的數(shù)據(jù):新聞文章、社交媒體帖子和科學(xué)論文。
為了讓 Orion 更智能,OpenAI 需要讓它更大。這意味著它需要更多的數(shù)據(jù),但目前還不夠。
“這變得非常昂貴,并且很難找到更多同等高質(zhì)量的數(shù)據(jù),”DatologyAI 的首席執(zhí)行官 Ari Morcos 說(shuō),該初創(chuàng)公司開發(fā)工具以改善數(shù)據(jù)選擇。Morcos 正在用更少但更好的數(shù)據(jù)構(gòu)建模型,他認(rèn)為這種方法將使今天的人工智能系統(tǒng)比所有頂級(jí)人工智能公司(如 OpenAI)所采用的策略更具能力。
OpenAI 的解決方案是從零開始創(chuàng)建數(shù)據(jù)。
它正在招聘人員為 Orion 編寫新的軟件代碼或解決數(shù)學(xué)問(wèn)題以供學(xué)習(xí)。這些工人中有些是軟件工程師和數(shù)學(xué)家,他們還與 Orion 分享他們工作的解釋。
許多研究人員認(rèn)為,代碼,軟件的語(yǔ)言,可以幫助LLMs解決它們尚未見過(guò)的問(wèn)題。
讓人們解釋他們的思考加深了新創(chuàng)建數(shù)據(jù)的價(jià)值。這為L(zhǎng)LM提供了更多的語(yǔ)言輸入;這也是模型未來(lái)如何解決類似問(wèn)題的地圖。
“我們正在將人類智慧從人類思維轉(zhuǎn)移到機(jī)器思維中,”Turing 的首席執(zhí)行官兼聯(lián)合創(chuàng)始人喬納森·西達(dá)特說(shuō)。Turing 是一家與 OpenAI、Meta等公司合作的人工智能基礎(chǔ)設(shè)施公司。
在人工智能訓(xùn)練中,Turing 高管表示,軟件工程師可能會(huì)被要求編寫一個(gè)有效解決復(fù)雜邏輯問(wèn)題的程序。數(shù)學(xué)家可能需要計(jì)算由一百萬(wàn)個(gè)籃球構(gòu)成的金字塔的最大高度的答案——更重要的是,如何得出這些答案——然后被納入人工智能訓(xùn)練材料中。
OpenAI 與理論物理等領(lǐng)域的專家合作,解釋他們將如何解決該領(lǐng)域一些最棘手的問(wèn)題。這也可以幫助 Orion 變得更聰明。
這個(gè)過(guò)程非常緩慢。GPT-4 的訓(xùn)練數(shù)據(jù)估計(jì)為 13 萬(wàn)億個(gè)標(biāo)記。1000 人每天寫 5000 個(gè)單詞需要幾個(gè)月才能產(chǎn)生 10 億個(gè)標(biāo)記。
OpenAI 還開始開發(fā)被稱為合成數(shù)據(jù)的數(shù)據(jù),即由 AI 創(chuàng)建的數(shù)據(jù),以幫助訓(xùn)練 Orion。研究表明,AI 為 AI 創(chuàng)建數(shù)據(jù)的反饋循環(huán)往往會(huì)導(dǎo)致故障或產(chǎn)生無(wú)意義的答案。
OpenAI 的科學(xué)家認(rèn)為,他們可以通過(guò)使用其另一個(gè) AI 模型生成的數(shù)據(jù)來(lái)避免這些問(wèn)題,該模型稱為 o1,知情人士表示。
OpenAI 原本就困難的任務(wù)因內(nèi)部動(dòng)蕩和競(jìng)爭(zhēng)對(duì)手幾乎不斷試圖挖走其頂尖研究人員而變得更加復(fù)雜,有時(shí)甚至提供數(shù)百萬(wàn)美元的報(bào)酬。
去年,奧特曼被 OpenAI 的董事會(huì)突然解雇,一些研究人員擔(dān)心公司是否會(huì)繼續(xù)運(yùn)營(yíng)。奧特曼很快被重新任命為首席執(zhí)行官,并著手改革 OpenAI 的治理結(jié)構(gòu)。
今年已有超過(guò)二十位關(guān)鍵高管、研究人員和長(zhǎng)期員工離開了 OpenAI,包括聯(lián)合創(chuàng)始人兼首席科學(xué)家伊利亞·蘇茨凱弗和首席技術(shù)官米拉·穆拉提。上周四,廣受尊敬的研究人員亞歷克·拉德福德宣布離職,他在 OpenAI 工作了大約八年,并擔(dān)任多篇科學(xué)論文的首席作者。
二、重啟
到 2024 年初,管理層開始感受到壓力。GPT-4 已經(jīng)發(fā)布一年,競(jìng)爭(zhēng)對(duì)手開始迎頭趕上。來(lái)自 Anthropic 的一款新LLM被業(yè)內(nèi)許多人評(píng)為優(yōu)于 GPT-4。幾個(gè)月后,谷歌推出了今年最具病毒傳播性的 AI 應(yīng)用,名為 NotebookLM。
隨著 Orion 的停滯,OpenAI 開始開發(fā)其他項(xiàng)目和應(yīng)用程序。它們包括精簡(jiǎn)版的 GPT-4 和 Sora,一個(gè)可以生成 AI 視頻的產(chǎn)品。
這導(dǎo)致了在新產(chǎn)品開發(fā)團(tuán)隊(duì)和 Orion 研究人員之間對(duì)有限計(jì)算資源的爭(zhēng)奪,知情人士表示。
人工智能實(shí)驗(yàn)室之間的競(jìng)爭(zhēng)變得如此激烈,以至于主要科技公司發(fā)布的關(guān)于最新發(fā)現(xiàn)或突破的論文比科學(xué)界的典型數(shù)量要少。兩年前,隨著資金涌入市場(chǎng),科技公司開始將這些研究成果視為需要保護(hù)的商業(yè)機(jī)密。一些研究人員對(duì)此非常認(rèn)真,他們不愿在飛機(jī)、咖啡店或任何可能有人從旁邊窺視他們工作的地方工作。
這種保密的態(tài)度讓許多長(zhǎng)期從事人工智能研究的人感到沮喪,包括 Meta 的首席人工智能科學(xué)家 Yann LeCun。LeCun 表示,OpenAI 和 Anthropic 的工作不應(yīng)再被視為研究,而應(yīng)被視為“高級(jí)產(chǎn)品開發(fā)”。
“如果你在商業(yè)時(shí)鐘上進(jìn)行這項(xiàng)工作,那就不叫研究,”LeCun 在最近的一次 AI 會(huì)議上說(shuō),當(dāng)時(shí) OpenAI 的參與很少?!叭绻阍诿孛苤羞M(jìn)行,那就不叫研究?!?/p>
在 2024 年初,OpenAI 準(zhǔn)備再次嘗試 Orion,這次配備了更好的數(shù)據(jù)。研究人員在年初的幾個(gè)月內(nèi)進(jìn)行了幾次小規(guī)模的訓(xùn)練,以增強(qiáng)信心。
到五月,OpenAI 的研究人員決定他們準(zhǔn)備好進(jìn)行另一次大規(guī)模的 Orion 訓(xùn)練,這次訓(xùn)練預(yù)計(jì)將持續(xù)到十一月。
一旦訓(xùn)練開始,研究人員發(fā)現(xiàn)數(shù)據(jù)存在一個(gè)問(wèn)題:它并不像他們想象的那樣多樣化,這可能限制了 Orion 的學(xué)習(xí)能力。
這個(gè)問(wèn)題在小規(guī)模的努力中并不明顯,只有在大型訓(xùn)練運(yùn)行開始后才變得明顯。OpenAI 已經(jīng)花費(fèi)了太多時(shí)間和金錢,無(wú)法重新開始。
相反,研究人員急忙尋找更廣泛的數(shù)據(jù)來(lái)在訓(xùn)練過(guò)程中為模型提供支持。目前尚不清楚這一策略是否有效。
Orion 的問(wèn)題向 OpenAI 的一些人發(fā)出了信號(hào),表明曾推動(dòng)其早期成功的“更多即是更多”策略正在失去動(dòng)力。
OpenAI 并不是唯一一家擔(dān)心進(jìn)展遇到瓶頸的公司。在整個(gè)行業(yè)中,關(guān)于人工智能的改進(jìn)是否開始停滯的辯論正在激烈進(jìn)行。
Ilya Sutskever 最近共同創(chuàng)辦了一家名為安全超級(jí)智能(SSI)的新人工智能公司,他在最近的一次人工智能會(huì)議上宣稱,最大數(shù)據(jù)時(shí)代已經(jīng)結(jié)束?!皵?shù)據(jù)沒(méi)有增長(zhǎng),因?yàn)槲覀冎挥幸粋€(gè)互聯(lián)網(wǎng),”他對(duì)一群研究人員、政策專家和科學(xué)家說(shuō)?!澳闵踔量梢哉f(shuō)數(shù)據(jù)是人工智能的化石燃料?!?/p>
而那燃料開始耗盡了。
三、推理
他們?cè)?Orion 的掙扎使 OpenAI 研究人員找到了讓LLM更聰明的新方法:推理。研究人員表示,花費(fèi)很長(zhǎng)時(shí)間“思考”可以讓LLMs解決他們未經(jīng)過(guò)訓(xùn)練的困難問(wèn)題。
在幕后,OpenAI 的 o1 為每個(gè)問(wèn)題提供多個(gè)回答,并分析它們以找到最佳答案。它可以執(zhí)行更復(fù)雜的任務(wù),比如撰寫商業(yè)計(jì)劃或創(chuàng)建填字游戲,同時(shí)解釋其推理過(guò)程——這有助于模型從每個(gè)答案中學(xué)習(xí)一點(diǎn)。
蘋果的研究人員最近發(fā)布了一篇論文,認(rèn)為推理模型,包括 o1 的版本,很可能是在模仿它們?cè)谟?xùn)練中看到的數(shù)據(jù),而不是實(shí)際解決新問(wèn)題。
蘋果研究人員表示,如果問(wèn)題被更改為包含無(wú)關(guān)細(xì)節(jié)——例如將關(guān)于獼猴桃的數(shù)學(xué)問(wèn)題調(diào)整為提到一些水果比其他水果小,他們發(fā)現(xiàn)“災(zāi)難性的性能下降”。
在九月份,OpenAI 推出了其 o1 推理模型的預(yù)覽,并在本月早些時(shí)候發(fā)布了 o1 的完整版本。
所有這些額外的腦力成本很高。OpenAI 現(xiàn)在支付費(fèi)用以生成對(duì)單個(gè)查詢的多個(gè)答案,而不僅僅是一個(gè)。
在一次最近的 TED 演講中,OpenAI 的一位高級(jí)研究科學(xué)家強(qiáng)調(diào)了推理的優(yōu)勢(shì)。
“結(jié)果發(fā)現(xiàn),讓機(jī)器人在一手撲克中思考 20 秒,獲得的性能提升與將模型規(guī)模擴(kuò)大 100,000 倍并訓(xùn)練 100,000 倍的時(shí)間相同,”O(jiān)penAI 科學(xué)家諾姆·布朗說(shuō)道。
一個(gè)更先進(jìn)和高效的推理模型可以構(gòu)成 Orion 的基礎(chǔ)。OpenAI 的研究人員正在追求這種方法,并希望將其與舊的方法結(jié)合起來(lái),即更多的數(shù)據(jù),其中一些數(shù)據(jù)可能來(lái)自 OpenAI 的其他 AI 模型。然后,OpenAI 可以用人類生成的材料來(lái)完善結(jié)果。
在星期五,奧特曼宣布了一種新的推理模型的計(jì)劃,這種模型比公司之前發(fā)布的任何模型都要智能。他沒(méi)有提到何時(shí)或是否會(huì)推出一個(gè)值得稱為 GPT-5 的模型。
來(lái)源 | Z Potentials
本文翻譯自:WSJ, https://www.wsj.com/tech/ai/openai-gpt5-orion-delays-639e7693?st=ng5hBi&reflink=desktopwebshare_permalink
編譯:ChatGPT
本文由人人都是產(chǎn)品經(jīng)理作者【產(chǎn)業(yè)家】,微信公眾號(hào):【產(chǎn)業(yè)家】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
本身Ai的發(fā)明就是科技的一大進(jìn)步,想要做到精益求精,要各方面完美結(jié)合,是有一定的難度的。