黃仁勛:英偉達(dá)將一年推一款全新芯片,沒有英偉達(dá)就沒有今天AI的一切(附最新演講全文)
英偉達(dá)是今天生成式AI浪潮里最大的贏家,而黃仁勛要告訴世界,這一切跟運(yùn)氣無(wú)關(guān),是英偉達(dá)預(yù)見并用實(shí)力創(chuàng)造了今天的一切。
6月2日晚,英偉達(dá)創(chuàng)始人和CEO黃仁勛在COMPUTEX開幕前發(fā)表了最新的主題演講,距離上一場(chǎng)在GTC上的重磅發(fā)布會(huì)僅僅三個(gè)月后,這場(chǎng)發(fā)布會(huì)依然干貨滿滿,甚至驚喜不斷。
除了更系統(tǒng)全面的梳理和展示了英偉達(dá)在加速計(jì)算和生成式AI上的最新成果,黃仁勛還劇透了下一代GPU架構(gòu)——
是的,“史上最強(qiáng)”的Blackwell剛剛公布三個(gè)月,而且還沒有開始量產(chǎn)發(fā)貨,下一代就在路上了。
黃仁勛表示,2025年英偉達(dá)會(huì)推出Blackwell Ultra,而2026年下一代架構(gòu)名字為Rubin,2027年繼續(xù)推出Rubin Ultra。
一年一款大更新,這節(jié)奏,已經(jīng)趕上手機(jī)廠商的發(fā)布節(jié)奏。
而且,這些大更新會(huì)繼續(xù)把推理成本指數(shù)級(jí)的打下來(lái)。這個(gè)路線圖的劇透,就像是黃式定律在秀肌肉。
一切盡在掌握。你們盡管買英偉達(dá)的卡就行了。
而在演講中,黃仁勛梳理英偉達(dá)從GPU,到CUDA,到最新的NIM,再到機(jī)器人和數(shù)字孿生平臺(tái)的一系列產(chǎn)品線的歷史時(shí),明顯的改變了講述風(fēng)格。
黃仁勛形容英偉達(dá)早就看到了CPU的瓶頸,因而走了GPU和加速計(jì)算的路——過往提到英偉達(dá)GPU產(chǎn)品線的誕生他還總是會(huì)謙虛,而業(yè)內(nèi)也總是把GPU形容為碰巧適合人工智能計(jì)算需求的芯片。但今天黃仁勛給出的因果關(guān)系變了。
“CUDA是英偉達(dá)和人工智能的第一次親密接觸。而那之后我們深入理解深度學(xué)習(xí)的本質(zhì),有意識(shí)的重新發(fā)明了一切。改變了GPU架構(gòu),增加Tensor核,發(fā)明NV link,推出cuDNN,TensorRT,Nickel,收購(gòu)Mellanox推出Triton等等。”這是英偉達(dá)的新敘事。
而其中,CUDA被黃仁勛大夸特夸?!叭绻麤]有我們精心打造的打造的各類特定領(lǐng)域的庫(kù),全球深度學(xué)習(xí)科學(xué)家們就無(wú)法充分利用潛力。CUDA就像OpenGL之于計(jì)算機(jī)圖形學(xué),SQL之于數(shù)據(jù)分析?!彼f。
“一個(gè)新的開發(fā)平臺(tái)和擁有大量的開發(fā)者,這是個(gè)雞生蛋的問題。它很少被打破。而我們把它打破了。我們花了20年的時(shí)間,一個(gè)個(gè)的域庫(kù),一個(gè)個(gè)加速庫(kù)的做,現(xiàn)在我們擁有500萬(wàn)開發(fā)人員。”黃仁勛不再需要謙虛。“CUDA已經(jīng)到了一個(gè)臨界點(diǎn),開始實(shí)現(xiàn)良性循環(huán)?!?/p>
黃仁勛在演講里,干脆不藏著掖著了,他把英偉達(dá)定義為今天世界上生成式AI浪潮的來(lái)源。
“人工智能崛起之所以有可能,完全因?yàn)槲覀兿嘈胖灰審?qiáng)大的計(jì)算變得越來(lái)越便宜,總會(huì)有人找到巨大的用途?!彼f?!罢?yàn)槲覀兝锰囟ㄋ惴▽⒂?jì)算邊際成本降低了100萬(wàn)級(jí)別,今天使用互聯(lián)網(wǎng)上的所有數(shù)據(jù)來(lái)訓(xùn)練大模型才成為了所有人默認(rèn)合乎邏輯的選擇,不再有人懷疑和質(zhì)疑這個(gè)做法?!?/p>
而在英偉達(dá)這么做之前,“沒有人預(yù)料到,沒有人提出這樣的需求。甚至沒有人理解全部潛力?!?/p>
在這場(chǎng)演講里,黃仁勛也不時(shí)說幾句中文。他給token提供了一個(gè)翻譯:詞元。
“今天我們可以為任何有價(jià)值的事物生成它的token。就像特斯拉發(fā)明交流電機(jī)給我們不斷產(chǎn)生電子,英偉達(dá)發(fā)明的是人工智能生成器,在不斷產(chǎn)生token。”
一切都與token有關(guān),而英偉達(dá)制造和掌握了這一切。
以下為這場(chǎng)發(fā)布會(huì)的核心要點(diǎn)和全文實(shí)錄。
核心要點(diǎn)整理:
- 新的架構(gòu)路線圖:2025年是Blackwell Ultra,2026年會(huì)有新架構(gòu)Rubin,2027年則是Rubin Ultra。
- 我們現(xiàn)在所處的不是AI時(shí)代,而是一個(gè)生成式AI時(shí)代。
- 幾乎世界萬(wàn)物都可以轉(zhuǎn)換成Token(詞元)。
- 價(jià)值3萬(wàn)億美元的IT產(chǎn)業(yè)將成為 AI 工廠,為每個(gè)行業(yè)制作 AI 產(chǎn)品。
- 我們需要基于物理并理解物理定律的AI。
- 每個(gè)裝有 RTX 顯卡的 PC,都是 AIPC。
- CUDA不僅達(dá)到了重要的成熟階段,還進(jìn)入了一個(gè)自我強(qiáng)化的良性循環(huán),不斷提升其性能和應(yīng)用價(jià)值。
- 隨著CPU性能增長(zhǎng)放緩,利用CUDA等技術(shù)加速計(jì)算任務(wù)是應(yīng)對(duì)計(jì)算需求指數(shù)級(jí)增長(zhǎng)的關(guān)鍵策略,未來(lái)所有處理密集型應(yīng)用和數(shù)據(jù)中心都將采用這一策略以保持效率和成本效益。
- 這 60 年來(lái),我們只見證了兩三次主要的技術(shù)變革,如今生成式 AI 使我們得以再次見證一次技術(shù)變革。
以下為全文實(shí)錄:
大家好!很高興再次來(lái)到這里。今晚我將在此舉辦一場(chǎng)“Don’t Walk”演講。因?yàn)槲覀円務(wù)摰氖虑楹芏?,時(shí)間緊迫,所以不能慢慢走,得用跑的。
今晚我將談?wù)撘韵聨讉€(gè)方面:
- 當(dāng)前的行業(yè)動(dòng)態(tài)、我們正在共同努力的方向是什么?
- 什么是生成式AI、它對(duì)我們及各行各業(yè)的影響?
- 以及我們將如何把握這個(gè)難得的機(jī)遇。接下來(lái)會(huì)發(fā)生什么?
- 生成式AI及其影響、我們的藍(lán)圖以及未來(lái)的展望。這些都是令人無(wú)比興奮的時(shí)刻。
一、重新梳理英偉達(dá)的歷史:沒有英偉達(dá)就沒有今天AI的一切
英偉達(dá)目前正處于計(jì)算機(jī)圖形模擬的交叉點(diǎn)上,這是我們的靈魂所在。我今天展示的一切都是模擬,是數(shù)學(xué),是科學(xué),是計(jì)算機(jī)科學(xué),是令人驚嘆的計(jì)算機(jī)體系結(jié)構(gòu)。所有內(nèi)容都不是動(dòng)畫制作的。這是英偉達(dá)的靈魂,我們把所有東西都放在了這個(gè)我們稱之為“Omniverse”的虛擬世界中。
你所看到的一切都基于兩項(xiàng)基本技術(shù):加速計(jì)算和人工智能。這兩種技術(shù)將重塑計(jì)算機(jī)行業(yè)。計(jì)算機(jī)行業(yè)從誕生至今已有60年的歷史。從很多方面來(lái)看,我們今天所做的一切都源于1964年,IBM System 360在那一年發(fā)明,引入了中央處理單元、通用計(jì)算,并通過操作系統(tǒng)實(shí)現(xiàn)了軟硬件分離。
多任務(wù)處理、I/O、子系統(tǒng)、DMA,我們今天使用的各種技術(shù)、架構(gòu)兼容性、向后兼容性以及我們今天所知道的關(guān)于計(jì)算的一切,主要是在1964年后誕生的。當(dāng)然,PC革命使計(jì)算民主化,并將其掌握在每個(gè)人手中。2007年,iPhone推出了移動(dòng)計(jì)算功能,并將電腦放進(jìn)了我們的口袋。從那時(shí)起,一切都通過移動(dòng)云始終連接和運(yùn)行。
在過去的60年里,我們看到兩三個(gè)主要的技術(shù)轉(zhuǎn)變,兩三個(gè)計(jì)算領(lǐng)域的結(jié)構(gòu)性轉(zhuǎn)變,一切都發(fā)生了變化。而這種情況即將再次發(fā)生。
第一個(gè)問題是處理器,計(jì)算機(jī)行業(yè)在中央處理單元上運(yùn)行的引擎,其性能擴(kuò)展已經(jīng)大大放緩。
然而,我們需要的計(jì)算量仍然以指數(shù)級(jí)的速度翻倍。如果我們需要處理的數(shù)據(jù)繼續(xù)呈指數(shù)級(jí)增長(zhǎng),但性能卻沒有,我們將經(jīng)歷計(jì)算膨脹。事實(shí)上,就在我們說話的時(shí)候,世界各地的數(shù)據(jù)中心電力數(shù)量正在大幅增長(zhǎng),計(jì)算機(jī)的成本也在不斷增長(zhǎng)。我們看到了計(jì)算通貨膨脹。
當(dāng)然,這種情況無(wú)法繼續(xù),數(shù)據(jù)將繼續(xù)呈指數(shù)級(jí)增長(zhǎng),而CPU性能擴(kuò)展永遠(yuǎn)不會(huì)恢復(fù)。近二十年來(lái),我們一直致力于加速計(jì)算,利用CUDA增強(qiáng)CPU,卸載和加速專用處理器可以做得更好的工作。現(xiàn)在很明顯,隨著CPU擴(kuò)展速度的減緩并最終大幅停止,我們應(yīng)該加速一切。
我預(yù)測(cè),每個(gè)處理密集型的應(yīng)用程序都將加速,并且每個(gè)數(shù)據(jù)中心都將在不久的將來(lái)加速?,F(xiàn)在,加速計(jì)算是非常明智的一件事。如果你看一下應(yīng)用程序,這里的100t意味著100個(gè)時(shí)間單位,它可能是100秒,也可能是100個(gè)小時(shí)。我們現(xiàn)在正在開發(fā)可以運(yùn)行100天的人工智能應(yīng)用程序。1t是需要順序處理的代碼,其中單線程CPU非常重要。
操作系統(tǒng)控制邏輯對(duì)于一條指令接著另一條指令執(zhí)行非常重要。然而,計(jì)算機(jī)圖形是一種可以完全并行操作的圖形。計(jì)算機(jī)圖形學(xué)、圖像處理、物理模擬、組合優(yōu)化、圖形處理、數(shù)據(jù)庫(kù)處理,當(dāng)然還有非常著名的深度學(xué)習(xí)線性代數(shù),有許多類型的算法非常有助于通過并行處理加速。
因此,我們發(fā)明了一種架構(gòu)來(lái)實(shí)現(xiàn)這一點(diǎn),通過向CPU添加GPU,讓專用處理器花費(fèi)大量時(shí)間并將其加速到令人難以置信的速度。因?yàn)檫@兩個(gè)處理器可以并排工作,所以它們都是自主的,并且都是獨(dú)立的。也就是說,我們可以將過去需要100個(gè)單位時(shí)間的東西加速到一個(gè)單位時(shí)間。
嗯,速度提升聽起來(lái)難以置信,但今天我將為您展示許多例子。好處是非常非凡的,它速度提升100倍,但功率只增加了大約3倍,而你只增加了約50%的成本。我們?cè)趥€(gè)人電腦行業(yè)一直在這樣做,我們?cè)黾恿艘粋€(gè)GPU,一個(gè)500美元的GeForce GPU,到1000美元的電腦,性能大大提高。我們?cè)谝粋€(gè)十億美元的數(shù)據(jù)中心里這樣做,我們?cè)黾恿藘r(jià)值5億美元的GPU,突然間它變成了一個(gè)AI工廠。
這在當(dāng)今世界各地都在發(fā)生。嗯,節(jié)省的成本是非常非凡的,您每美元可以獲得60倍的性能,100倍的速度,加速,您只需要將功率增加3倍,100倍的速度,您只需要將成本增加1.5倍。節(jié)省的成本令人難以置信。很明顯,許多公司花費(fèi)數(shù)億美元在云端處理數(shù)據(jù)。如果它被加速,你可以節(jié)省數(shù)億美元,這并不出乎意料。
現(xiàn)在為什么呢?原因很清楚。
我們?cè)谕ㄓ糜?jì)算領(lǐng)域已經(jīng)經(jīng)歷了很長(zhǎng)時(shí)間的通貨膨脹。現(xiàn)在我們終于決心加速,這可以幫我們挽回巨大的損失。大量捕獲的廢數(shù)據(jù)現(xiàn)在可以將其從系統(tǒng)中釋放出來(lái),這將轉(zhuǎn)化為儲(chǔ)蓄,儲(chǔ)蓄和金錢,儲(chǔ)蓄和能源。這就是為什么你聽我說你買的越多,你說的就越多。你買的越多,就越安全。加速計(jì)算確實(shí)提供了非凡的結(jié)果,但這并不容易。
沒有所謂的軟件可以通過交流編譯器運(yùn)行,然后突然之間該應(yīng)用程序的運(yùn)行速度提高了100倍。這甚至不符合邏輯。如果可以做到這一點(diǎn),他們只需要更改CPU。要做到這一點(diǎn),實(shí)際上你必須重寫軟件,以便您可以重構(gòu)在CPU上編寫的算法,以便它可以被加速、卸載、加速和并行運(yùn)行。計(jì)算機(jī)科學(xué)練習(xí)非常難,在過去的20年里,我們已經(jīng)讓它變得容易了。
當(dāng)然,非常著名的cuDNN,即處理神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)庫(kù),我們有一個(gè)人工智能物理學(xué)庫(kù),您可以將其用于流體動(dòng)力學(xué)和許多其他應(yīng)用,其中神經(jīng)網(wǎng)絡(luò)必須遵守物理定律。
我們有一個(gè)很棒的新項(xiàng)目,叫做Aerial,它是一個(gè)CUDA加速的5G無(wú)線電,這樣我們就可以用軟件定義和加速電信網(wǎng)絡(luò),就像我們解決軟件定義世界網(wǎng)絡(luò)互聯(lián)網(wǎng)一樣。因此,我們加速的能力使我們能夠?qū)⑺须娦抛兂苫旧舷嗤愋偷钠脚_(tái)、計(jì)算平臺(tái)事業(yè)部,就像我們?cè)谠贫艘粯印?/p>
cuLitho是一個(gè)計(jì)算光刻平臺(tái),使我們能夠處理芯片制造中計(jì)算密集型的部分,使得臺(tái)積電(TSMC)掩模使用cuLitho進(jìn)行生產(chǎn),節(jié)省了大量的能源和資金。但是臺(tái)積電的目標(biāo)是加速他們的堆棧,以便他們?yōu)樗惴ǖ倪M(jìn)一步進(jìn)步和更深入的網(wǎng)絡(luò)和窄晶體管的更多計(jì)算做好準(zhǔn)備。
這是我們的基因測(cè)序庫(kù)。它是世界上最高通量的基因測(cè)序庫(kù)。cuOpt 是一個(gè)令人難以置信的庫(kù),用于組合優(yōu)化、路線規(guī)劃優(yōu)化等問題??茖W(xué)家們已經(jīng)得出結(jié)論,你需要一臺(tái)量子計(jì)算機(jī)來(lái)做這件事,我們創(chuàng)建了一個(gè)運(yùn)行在加速計(jì)算上的算法,它運(yùn)行得像閃電一樣快,創(chuàng)造了23項(xiàng)世界紀(jì)錄。我們今天保持著每一項(xiàng)主要的世界紀(jì)錄。
cuQuantum是量子計(jì)算機(jī)的仿真系統(tǒng)。如果你想設(shè)計(jì)一臺(tái)量子計(jì)算機(jī),你需要一個(gè)模擬器來(lái)完成。如果你想設(shè)計(jì)量子算法,你需要一個(gè)量子模擬器來(lái)實(shí)現(xiàn)。如果量子計(jì)算機(jī)不存在,你將如何設(shè)計(jì)這些量子計(jì)算機(jī),創(chuàng)建這些量子算法?你可以使用當(dāng)今世界上最快的計(jì)算機(jī),我們稱之為NVIDIA CUDA,并且在其上我們有一個(gè)模擬量子計(jì)算機(jī)的模擬器,它被世界各地的數(shù)十萬(wàn)研究人員使用。它被集成到所有領(lǐng)先的量子計(jì)算框架中,并在世界各地的科學(xué)超級(jí)計(jì)算中心中使用,是一個(gè)令人難以置信的數(shù)據(jù)處理庫(kù)。
數(shù)據(jù)處理消耗了絕大多數(shù)的云指出,而僅靠CUDA是不可能的,世界各地的深度學(xué)習(xí)科學(xué)家都無(wú)法使用,CUDA、TensorFlow和PyTorch中使用的算法、深度學(xué)習(xí)算法分離得太遠(yuǎn)了。
這幾乎就像嘗試在沒有OpenGL的情況下進(jìn)行計(jì)算機(jī)圖形處理一樣,就像在沒有SQL的情況下進(jìn)行數(shù)據(jù)處理一樣。這些特定領(lǐng)域的庫(kù)真的是我們公司的財(cái)富。我們有350個(gè)庫(kù),正是它們使我們能夠擁有如此開放的市場(chǎng)的原因。
今天我會(huì)給你看一些其他的例子。就在上周,谷歌宣布他們已經(jīng)將cuDF放入云端并加速Pandas。Pandas是世界上最受歡迎的數(shù)據(jù)科學(xué)庫(kù)。在座的許多人可能已經(jīng)在使用Pandas了。它被全球1000萬(wàn)數(shù)據(jù)科學(xué)家使用,每月被下載1.7億次。Excel是數(shù)據(jù)科學(xué)家的電子表格。只需單擊一下,您現(xiàn)在就可以在Colab中使用Pandas,這是谷歌的云數(shù)據(jù)中心平臺(tái),由cuDF加速。速度真的令人難以置信。那是個(gè)很棒的演示,對(duì)吧?
當(dāng)您加快數(shù)據(jù)處理速度時(shí),演示不需要很長(zhǎng)時(shí)間。CUDA現(xiàn)在已經(jīng)達(dá)到了人們所說的臨界點(diǎn),但它甚至比這更好,CUDA現(xiàn)在已經(jīng)達(dá)到了一個(gè)良性循環(huán)。如果你回顧歷史和所有的計(jì)算架構(gòu)、計(jì)算平臺(tái),這種情況很少發(fā)生。
在微處理器CPU的情況下,它已經(jīng)存在了60年。在這個(gè)水平上60年沒有改變。
加速計(jì)算已經(jīng)出現(xiàn),創(chuàng)建一個(gè)新的平臺(tái)非常困難,因?yàn)檫@是一個(gè)先有雞還是先有蛋的問題。如果沒有開發(fā)人員使用您的平臺(tái),那么當(dāng)然就沒有用戶,但是如果沒有用戶,就沒有安裝基礎(chǔ)。如果沒有基于安裝的開發(fā)人員對(duì)它不感興趣。開發(fā)人員希望為大型安裝基礎(chǔ)編寫軟件,但大型安裝基礎(chǔ)需要大量應(yīng)用程序,以便用戶可以創(chuàng)建該安裝基礎(chǔ)。
這個(gè)雞或蛋的問題很少被打破,現(xiàn)在已經(jīng)花了我們20年的時(shí)間。一個(gè)個(gè)的域庫(kù),一個(gè)個(gè)加速庫(kù),現(xiàn)在我們?cè)谌驌碛?00萬(wàn)開發(fā)人員。我們服務(wù)于每一個(gè)行業(yè),包括醫(yī)療保健、金融服務(wù)、計(jì)算機(jī)行業(yè)、汽車行業(yè),以及世界上幾乎每一個(gè)主要行業(yè),幾乎每一個(gè)科學(xué)領(lǐng)域。因?yàn)槲覀兊慕ㄖ泻芏嗫蛻?。OEM和云服務(wù)提供商對(duì)構(gòu)建我們的系統(tǒng)感興趣。
系統(tǒng)制造商對(duì)構(gòu)建我們的系統(tǒng)感興趣,然后將更多的系統(tǒng)推向市場(chǎng),這當(dāng)然為我們創(chuàng)造了更大的機(jī)會(huì),這使我們能夠增加我們的研發(fā)規(guī)模,從而進(jìn)一步加快應(yīng)用程序的速度。嗯,每一次我們加速應(yīng)用程序,計(jì)算成本就會(huì)下降。
就像我在幻燈片里演示的一樣,100倍加速比轉(zhuǎn)化為97%、96%、98%,因此當(dāng)我們從100倍速度提高到200倍速度提高到1000倍速度時(shí),計(jì)算的邊際成本節(jié)省將繼續(xù)下降。
當(dāng)然,我們相信通過令人難以置信地降低計(jì)算成本,市場(chǎng)開發(fā)者、科學(xué)家、發(fā)明家將繼續(xù)發(fā)現(xiàn)新的算法,這些算法消耗越來(lái)越多的計(jì)算資源,這樣總有一天會(huì)發(fā)生面部表情的變化。計(jì)算的邊際成本如此之低,以至于出現(xiàn)了一種新的使用計(jì)算機(jī)的方式。
事實(shí)上,這就是我們多年來(lái)所看到的,在過去10年中,我們已經(jīng)將一個(gè)特定算法的邊際計(jì)算成本降低了一百萬(wàn)倍。因此,現(xiàn)在使用互聯(lián)網(wǎng)上的所有數(shù)據(jù)來(lái)訓(xùn)練大型語(yǔ)言模型是其實(shí)是非常合乎邏輯的一件事。沒有人會(huì)三思而后行,認(rèn)為你可以創(chuàng)建一臺(tái)能夠處理如此多數(shù)據(jù)的計(jì)算機(jī)來(lái)編寫自己的軟件。
人工智能的出現(xiàn)之所以成為可能,是因?yàn)槲覀兺耆嘈牛绻覀冏層?jì)算變得越來(lái)越便宜,就會(huì)有人發(fā)現(xiàn)它有很大的用處。
好的,今天,CUDA已經(jīng)實(shí)現(xiàn)了良性循環(huán),安裝基礎(chǔ)正在增長(zhǎng),計(jì)算成本正在下降,這使得更多的開發(fā)人員提出更多的想法,從而推動(dòng)更多的需求。
現(xiàn)在我們正處于一件非常重要的事情的開始。但在我公布之前,我想先說下什么是不可能的,如果不是因?yàn)槲覀儎?chuàng)造了現(xiàn)代版本的通用AI,生成AI。那我們的新產(chǎn)品將不可能實(shí)現(xiàn)。
這個(gè)是地球2號(hào),我們將創(chuàng)建地球的數(shù)字孿生體,我們將前往模擬地球,以便我們可以預(yù)測(cè)地球的未來(lái),幫助我們更好地避免災(zāi)難或更好地了解氣候變化的影響,讓我們可以更好地適應(yīng)新環(huán)境,改變生活習(xí)慣。
這個(gè)地球的數(shù)字孿生體,可能是世界上有史以來(lái)最雄心勃勃的項(xiàng)目之一。我們每年都在向前邁出一大步。今年,我們?nèi)〉昧艘恍┲卮笸黄?,舉例來(lái)說。
周一,風(fēng)暴將再次向北并接近。它的路徑存在很大的不確定性,不同的路徑將對(duì)頂部產(chǎn)生不同程度的影響。想象一個(gè)我們能夠預(yù)測(cè)未來(lái)的世界——數(shù)字孿生,一個(gè)反映真實(shí)情況的虛擬世界,讓我們看見未來(lái)。數(shù)字孿生是一種反映真實(shí)世界的虛擬模型,讓我們能夠從今天的行為來(lái)預(yù)測(cè)對(duì)未來(lái)世界的影響。
介紹一下NVIDIA Earth-2,一個(gè)利用AI物理模擬和電腦圖形技術(shù)來(lái)預(yù)測(cè)全球氣候的數(shù)字孿生。FourCastNet是NVIDIA的生成式AI模型,它在WRF數(shù)值模擬的基礎(chǔ)上訓(xùn)練而成,能夠以12倍更高的分辨率生成天氣模式,從25公里提高到2公里,這代表了區(qū)域天氣預(yù)測(cè)的一個(gè)巨大飛躍。
令人驚訝的是,F(xiàn)ourCastNet比傳統(tǒng)的物理模擬方法快1000倍,且能源效率高3000倍。在氣象局,我們使用這些模型來(lái)更精確地預(yù)測(cè)臺(tái)風(fēng)登陸點(diǎn)。
但我們并不止步于此。
下一個(gè)前沿是超本地預(yù)測(cè),能精確到數(shù)十米,并考慮到城市基礎(chǔ)設(shè)施的影響。FourCastNet AI還在使用像是PALM生成的高分辨率數(shù)據(jù)進(jìn)行訓(xùn)練。一個(gè)極高分辨率的物理模型用于模擬大氣和海洋邊界層。當(dāng)與天氣模擬風(fēng)場(chǎng)結(jié)合一起時(shí),它可以模擬建筑物周圍的氣流。當(dāng)強(qiáng)風(fēng)匯聚的情況,我們預(yù)計(jì)能夠預(yù)測(cè)下沖這樣的現(xiàn)象。當(dāng)強(qiáng)風(fēng)匯聚到街道上,有可能造成損壞并影響行人。
NVIDIA Earth-2是一個(gè)絕佳范例,它融合了人工智能、物理模擬和觀測(cè)數(shù)據(jù),可以幫助國(guó)家和公司預(yù)見未來(lái)并應(yīng)對(duì)極端天氣的影響。
不久的將來(lái),我們可以隨時(shí)隨地提出我們的氣象預(yù)報(bào)。我們可以隨時(shí)掌握當(dāng)?shù)氐臍夂蜃兓?。而且它是連續(xù)性的預(yù)測(cè),為什么呢?因?yàn)槲覀円呀?jīng)把這個(gè)AI都訓(xùn)練好了,而且它不需要消耗太多的電力。
希望大家喜歡剛才我們的這個(gè)例子,我的國(guó)語(yǔ)講得標(biāo)準(zhǔn)嗎?但這不是我說的,這個(gè)是Jason AI說的,我給他寫了這個(gè)臺(tái)詞,由Jason AI也就是我的數(shù)字孿生體幫我做旁白的,所以我的國(guó)語(yǔ)不夠好,但我有孿生幫我做的旁白,這真的是一個(gè)奇跡。
之前在2012年,我們正致力于推進(jìn)CUDA,致力于不斷提高驅(qū)動(dòng)器的性能并降低成本,此時(shí)研究人員發(fā)現(xiàn)了AI,這是英偉達(dá)與AI的第一次接觸。
這是一個(gè)非常重要的時(shí)間。我們與優(yōu)秀科學(xué)家合作,使深度學(xué)習(xí)發(fā)生成為可能。當(dāng)然,AlexNet實(shí)現(xiàn)了計(jì)算機(jī)視覺方面的巨大突破。但我們還需要了解背景是什么,深度學(xué)習(xí)的基礎(chǔ)是什么,它的長(zhǎng)期影響是什么,它的潛力是什么?
我們意識(shí)到這項(xiàng)技術(shù)具有巨大的潛力,可以擴(kuò)展幾十年前發(fā)明并發(fā)現(xiàn)的算法。突然之間,我們需要更多的數(shù)據(jù),更大的網(wǎng)絡(luò),非常重要的是,更多的計(jì)算。突然間,深度學(xué)習(xí)能夠?qū)崿F(xiàn)人類算法現(xiàn)在無(wú)法想象的目標(biāo)。如果我們進(jìn)一步擴(kuò)展架構(gòu),使用更大的網(wǎng)絡(luò),更多的數(shù)據(jù)和更多的計(jì)算,會(huì)發(fā)生什么呢?所以我們致力于重新發(fā)明一切。
在2012年之后,我們改變了GPU的架構(gòu)以添加Tensor Core,我們發(fā)明了10年前的NVLink,現(xiàn)在可以使用TensorRT。我們購(gòu)買了Mellanox,TensorRT,以嘗試推理服務(wù)器,所有這些都整合在一臺(tái)全新的計(jì)算機(jī)上。
沒有人理解,事實(shí)上,我確信沒有人想買它,所以我們?cè)贕TC上和OpenAI介紹它,它當(dāng)時(shí)還是舊金山的一家小公司,他們要求我給他們送一個(gè)。我在2016年向OpenAI交付了第一臺(tái)DGX,世界上第一臺(tái)AI超級(jí)計(jì)算機(jī)。
好的,在那之后,我們繼續(xù)從1臺(tái)AI超級(jí)計(jì)算機(jī)、1臺(tái)AI設(shè)備擴(kuò)展到大型超級(jí)計(jì)算機(jī),到2017年甚至有了Transformer,這樣我們就可以訓(xùn)練大量數(shù)據(jù)并識(shí)別和學(xué)習(xí)在很長(zhǎng)一段時(shí)間內(nèi)順序排列的模式。現(xiàn)在我們可以訓(xùn)練這些大型語(yǔ)言模型來(lái)理解并實(shí)現(xiàn)自然語(yǔ)言理解突破,之后我們繼續(xù)努力,建造了更大的模型。
然后在2020年10月22日,在一臺(tái)非常大的AI超級(jí)計(jì)算機(jī)上訓(xùn)練了數(shù)千、數(shù)萬(wàn)個(gè)NVIDIA GPU。OpenAI五天后宣布ChatGPT達(dá)到100萬(wàn)用戶,五天后增加100萬(wàn)用戶,兩個(gè)月后增加1億用戶,這是歷史上增長(zhǎng)最快的應(yīng)用程序。
這背后的原因非常簡(jiǎn)單,它非常易于使用,使用起來(lái)非常神奇,能夠像人類一樣與計(jì)算機(jī)交互,而且清楚地知道你想要什么,就像計(jì)算機(jī)理解你的意思。
二、未來(lái)一切都與Token有關(guān),而一切Token都由英偉達(dá)來(lái)生成
ChatGPT還沒有跟大家見面之前,所謂的人工智能都是需要如何理解自然語(yǔ)言、電腦視覺、語(yǔ)音的識(shí)別。換句話說是感知的能力,偵測(cè)的能力。
這是我們第一次看到有生成式的人工智能系統(tǒng)出現(xiàn),它可以產(chǎn)生我們所謂的詞元(token),一次產(chǎn)生一個(gè)詞元,而這些詞元就變成是我們的文字。當(dāng)然有些詞元它可能是影像,它可能是線圖,可能是表格、歌曲、演講、視訊、影片,有可能是任何形式,只要是有意義的,都算是,甚至包括蛋白質(zhì)、化學(xué)分子等等。
你之前在NVIDIA Earth-2中看到的,我們正在生成天氣的詞元。我們可以理解,我們可以學(xué)習(xí)物理。如果你能學(xué)習(xí)物理,你可以教一個(gè)AI模型物理知識(shí)。AI模型可以學(xué)習(xí)物理學(xué)的含義,并且可以生成物理學(xué)。我們用的不是過濾的方法,我們用的是深層次的人工智能,讓我們的分辨率,氣候預(yù)報(bào)的分辨率不斷的提高。所以幾乎所有的事情都可以把它轉(zhuǎn)換成Token,Token是非常有價(jià)值的。
我們現(xiàn)在所處的不是AI時(shí)代,而是一個(gè)生成式AI時(shí)代。那它的重要性在哪里呢?原本我們說這是一部超級(jí)電腦,可是它現(xiàn)在不斷的進(jìn)化,它已經(jīng)變成了資料中心。而且它生產(chǎn)的東西是什么?就是資源。這就是一個(gè)人工智能工廠。他們產(chǎn)生的是新形態(tài)的大宗商品,每個(gè)產(chǎn)業(yè)都用得到,具有無(wú)比的價(jià)值。而他更好的是,他這種方法是可以復(fù)制的,是可以擴(kuò)展的。因此你們有沒有注意到,現(xiàn)在我們每一天都有一些新的生成式的AI模型被打造出來(lái)。
價(jià)值3萬(wàn)億美元的IT產(chǎn)業(yè),即將創(chuàng)造一些可以直接服務(wù)于價(jià)值100萬(wàn)億美元的產(chǎn)業(yè)的東西,不再僅僅是信息存儲(chǔ)或數(shù)據(jù)處理的工具。而是一個(gè)為每個(gè)行業(yè)生成智能的工廠。AI 將帶來(lái)一個(gè)全新的制造業(yè),不是計(jì)算機(jī)制造業(yè),而是在制造業(yè)中使用計(jì)算機(jī)。
這是一場(chǎng)工業(yè)革命,而不僅僅是對(duì)我們行業(yè)的影響。我們可以為許多行業(yè)創(chuàng)造一種新的商品,一種我們稱之為“詞元”(token)的新產(chǎn)品。
正如我之前所說,60年來(lái),不同的運(yùn)算方式都在改變。從CPU到通用目的的運(yùn)算,到加速的GPU運(yùn)算。以前電腦需要指令命令,現(xiàn)在它可以去處理大型語(yǔ)言模型、AI模型。
現(xiàn)在計(jì)算機(jī)處理大型語(yǔ)言模型、AI模型,而過去的計(jì)算模型是基于檢索的,幾乎每次你觸摸手機(jī)時(shí),一些預(yù)先錄制的文本、預(yù)先錄制的圖像或預(yù)先錄制的視頻會(huì)為您檢索,并根據(jù)推薦系統(tǒng)重新合成,以根據(jù)您的習(xí)慣呈現(xiàn)給您。
但在未來(lái),你的計(jì)算機(jī)將盡可能多地生成,只檢索必要的內(nèi)容。其原因是生成的數(shù)據(jù)需要較少的能量來(lái)獲取信息。生成的數(shù)據(jù)也更具上下文相關(guān)性。它將對(duì)知識(shí)進(jìn)行編碼,它將編碼你對(duì)你的理解,而不是為我獲取這些信息或?yàn)槲耀@取那個(gè)文件。
在未來(lái),你只需要問電腦,它就能提供你需要的檔案和信息。未來(lái)的電腦不再只是我們所使用的工具了。未來(lái)電腦它甚至能夠生成新的技能,它會(huì)幫你做一些工作。所以未來(lái)這個(gè)產(chǎn)業(yè)它不再只是去設(shè)計(jì)軟件,設(shè)計(jì)應(yīng)用程序。
當(dāng)你使用ChatGPT時(shí),在它們的堆棧下面是一堆軟件,在提示符下面是軟件,這是非常復(fù)雜的,因?yàn)槟P陀袛?shù)十億到萬(wàn)億個(gè)參數(shù)。它不是只在一臺(tái)計(jì)算機(jī)上運(yùn)行,而是在多臺(tái)計(jì)算機(jī)上運(yùn)行。它必須將工作負(fù)載分布在多個(gè)GPU上,張量并行,管道并行數(shù)據(jù),各種并行,專家并行,各種并行,將工作負(fù)載分布在多個(gè)GPU上,盡可能快地處理它。
當(dāng)然,這在90年代是非常了不起的。大家別忘記當(dāng)時(shí)微軟他們有這個(gè)套裝軟件,可以說是改變了整個(gè)電腦的產(chǎn)業(yè)。
因?yàn)槿绻麤]有這些套裝軟件的話,我們干嘛要電腦呢?我們電腦能拿來(lái)做什么呢?
所以這些套裝軟件當(dāng)然推動(dòng)了整個(gè)產(chǎn)業(yè)。但是現(xiàn)在我們有新的工廠,新的電腦,我們現(xiàn)在也會(huì)有新的軟件,我們就把它叫做NIM,NVIDIA的推理即服務(wù)。這個(gè)NIM它是在工廠里頭運(yùn)行的,而這個(gè)NIM它是一個(gè)預(yù)先訓(xùn)練的模型,它是一個(gè)AI。這個(gè)AI當(dāng)然本身是非常的復(fù)雜,但是去運(yùn)行這個(gè)AI的運(yùn)算堆疊,它非常的復(fù)雜。
你去使用ChatGPT, 它底下有非常非常多軟件。你下一個(gè)指令,你下一個(gè)提示,背后其實(shí)有非常多的軟件正在跑。所以它不只是在一個(gè)參數(shù)上面跑,是數(shù)以萬(wàn)計(jì)、數(shù)以億計(jì)的這個(gè)運(yùn)算參數(shù)在跑。它需要做Tensor的各式各樣的并行、不同的平行等等平行運(yùn)算。所以它有各式各樣的平行在走,它在不同的GPU上分配它的這個(gè)作業(yè)負(fù)載,它的速度也非常的快。
如果我們今天要經(jīng)營(yíng)工廠的話,你的這個(gè)產(chǎn)量是多少?跟你的服務(wù)品質(zhì),跟你的營(yíng)收,跟有多少人可以使用你的服務(wù)有非常正向的關(guān)系。
我們現(xiàn)在的這個(gè)資料中心,它的傳輸量非常的大,所以傳輸量的使用率就很重要了。以前也很重要,只是沒那么重要。以前很重要,但是大家不會(huì)去測(cè)量它?,F(xiàn)在每一個(gè)參數(shù)都必須要測(cè)量起始時(shí)間、使用時(shí)間、利用率、idle的時(shí)間等等。因?yàn)楝F(xiàn)在它就變成是一座工廠了。它一旦它變成工廠,它的一切的運(yùn)行就會(huì)跟這家公司它的財(cái)務(wù)表現(xiàn)有很密切的關(guān)系。我們知道對(duì)于大部分的公司來(lái)說,這都是非常復(fù)雜的事情。
三、你在AI時(shí)代需要的,英偉達(dá)全都有
所以我們就去把這個(gè)AI裝進(jìn)了一個(gè)盒子里頭,這些容器,這些container里頭有非常多很棒的軟件。
在這個(gè)容器里頭有CUDA、cuDNN、TensorRT Triton,它是推理即服務(wù),它是在云端上的一個(gè)堆疊。
除此之外它也有各式各樣的管理的服務(wù),還有hooks可以去讓大家監(jiān)督自己的AI,它有通用的API、標(biāo)準(zhǔn)的API,所以基本上你就可以跟這個(gè)盒子來(lái)對(duì)話,你把這個(gè)推理即服務(wù)下載,你可以跟他對(duì)話。所以你在只要你的電腦上有CUDA,基本上現(xiàn)在基本上每一組每每一朵云上面都有,有數(shù)億臺(tái)電腦上面都有。大家把它下載之后,你就有AI你可以跟他對(duì)話,就像你跟ChatGPT對(duì)話一樣。所有的軟件現(xiàn)在都整合在一起了,四百多個(gè)dependency都把它整合在一起。
我們測(cè)試了這些NIM,每一個(gè)都是預(yù)先訓(xùn)練的,是他們都是可以安裝的。在各種云上面,不管是Pascal或者是Ampere,各種不同的版本,Hopper也可以各式各樣不同的版本。我甚至還會(huì)忘記有哪一些。所以NIM這個(gè)NVIDIA的推理即服務(wù),真的是很棒的一個(gè)發(fā)明,我真的非常的喜歡。我想大家也知道,我們現(xiàn)在可以創(chuàng)造各式各樣的大型語(yǔ)言模型,還有預(yù)先訓(xùn)練的模型。我們有各式各樣不同的版本,不管它是語(yǔ)言版本的,或者視覺,或者是圖片版本為主的,或者是說針對(duì)這個(gè)醫(yī)療保健產(chǎn)業(yè)的、數(shù)字生物產(chǎn)業(yè)的。
我們還有是所謂的數(shù)字人。甚至我們可以請(qǐng)大家去看一下,我們今天才貼了Hugging Face這個(gè)Llama 2 NIM,它是完全優(yōu)化的,大家可以去試試看,甚至可以帶著走,那是免費(fèi)的。所以大家可以在云上面來(lái)運(yùn)行,然后可以下載這個(gè)容器放在自己的資料中心里頭,你可以放在自己的資料中心提供給你的客戶使用。
使用它的方式是將這些微服務(wù)連接到大型應(yīng)用程序中。當(dāng)然,未來(lái)最重要的應(yīng)用之一是客戶服務(wù)代理。幾乎每個(gè)行業(yè)都需要客戶服務(wù)代理。它代表著全球數(shù)萬(wàn)億美元的客戶服務(wù)。護(hù)士在某些方面是客戶服務(wù)代理,其中一些是非處方或非診斷性質(zhì)的。
現(xiàn)在可以通過語(yǔ)言模型和AI增強(qiáng)數(shù)千萬(wàn)的客戶服務(wù),所以你看到的基本上是NIM,其中一些NIM是給定任務(wù)的推理代理,找出任務(wù)是什么,將其分解成一個(gè)計(jì)劃。一些NIM檢索信息,一些NIM可能會(huì)去搜索,可能一些NIM會(huì)使用我之前提到的cuDF工具,他們可以使用一種可以在SAP上運(yùn)行的工具,因此它必須學(xué)習(xí)一種名為ABAP的特定語(yǔ)言。也許一些NIM必須進(jìn)行SQL查詢。
因此,所有這些NIM都是現(xiàn)在組成一個(gè)團(tuán)隊(duì)的專家。應(yīng)用層已經(jīng)發(fā)生了變化,曾經(jīng)用指令編寫的應(yīng)用程序現(xiàn)在變成了組裝團(tuán)隊(duì)的應(yīng)用程序,很少有人知道如何編寫程序。幾乎每個(gè)人都知道如何分解問題并組建團(tuán)隊(duì)。
我相信未來(lái)的每家公司都將擁有大量的NIM團(tuán)隊(duì),你可以帶下你想要的專家,將他們連接成一個(gè)團(tuán)隊(duì),你甚至不需要弄清楚如何連接他們,你只需將任務(wù)交給代理人。給一個(gè)名字,以找出誰(shuí)來(lái)分解任務(wù)以及將任務(wù)交給誰(shuí)。然后,應(yīng)用程序的領(lǐng)導(dǎo)者,如果你愿意,團(tuán)隊(duì)的領(lǐng)導(dǎo)者會(huì)分解任務(wù)并將其交給各個(gè)團(tuán)隊(duì)成員,團(tuán)隊(duì)成員將執(zhí)行他們的任務(wù),并將其帶回團(tuán)隊(duì)領(lǐng)導(dǎo)者。
團(tuán)隊(duì)領(lǐng)導(dǎo)會(huì)對(duì)此進(jìn)行推理,并向您反饋信息,就像人類一樣。在不久的將來(lái),這就是應(yīng)用程序的外觀?,F(xiàn)在我們可以通過文本提示和語(yǔ)音提示與這些大型AI服務(wù)進(jìn)行交互,但是,在許多應(yīng)用程序中,我們希望與其他類似人類的形式進(jìn)行交互。我們稱它們?yōu)閿?shù)字人類。英偉達(dá)研究數(shù)字人類技術(shù)已經(jīng)有一段時(shí)間了。
數(shù)字人類有潛力成為一個(gè)偉大的互動(dòng)代理,與你互動(dòng),他們可以讓你更有吸引力,更有同理心。當(dāng)然,我們必須跨越這個(gè)令人難以置信的鴻溝,這個(gè)不可思議的現(xiàn)實(shí)主義鴻溝,這樣數(shù)字人類就會(huì)顯得更加自然。這當(dāng)然是我們的愿景,這是我們喜歡去的地方的愿景,但讓我向您展示我們現(xiàn)在的位置。
想象一下,未來(lái)的計(jì)算機(jī)可以像人類一樣與我們互動(dòng)。這就是數(shù)字人類令人難以置信的潛力。數(shù)字人類將徹底改變從客戶服務(wù)到廣告和游戲的各個(gè)行業(yè)。
利用手機(jī)掃描廚房,AI室內(nèi)設(shè)計(jì)師就能生成照片級(jí)逼真的設(shè)計(jì)建議,并采購(gòu)材料和家具。我們已經(jīng)為您生成了幾種設(shè)計(jì)方案。數(shù)字人類還可以成為AI客戶服務(wù)代理,提供更具吸引力的互動(dòng)體驗(yàn),或化身數(shù)字醫(yī)療保健工作者,提供及時(shí)、個(gè)性化的護(hù)理。他們甚至可以成為AI品牌大使,引領(lǐng)營(yíng)銷和廣告的新潮流。
生成式人工智能和計(jì)算機(jī)圖形學(xué)的新突破,讓數(shù)字人類能夠以人類的方式看、聽、理解和與我們互動(dòng)。從我看到的,您似乎正在進(jìn)行某種錄音或制作。數(shù)字人類的基礎(chǔ)是基于多語(yǔ)言語(yǔ)音識(shí)別和合成的人工智能模型,以及能夠理解和生成對(duì)話的人工智能模型。
AI連接到另一個(gè)生成式AI,動(dòng)態(tài)制作逼真的3D面部網(wǎng)格動(dòng)畫。最后,能夠重現(xiàn)逼真外觀的人工智能模型實(shí)現(xiàn)了實(shí)時(shí)路徑追蹤和次表面散射,模擬光線穿透皮膚、散射并在不同點(diǎn)離開的方式,使皮膚呈現(xiàn)出柔軟和半透明的外觀。
NVIDIA Ace是一套數(shù)字人類技術(shù),打包成易于部署、完全優(yōu)化的微服務(wù)或“Nim”。開發(fā)人員可以將Ace Nim集成到他們現(xiàn)有的框架、引擎和數(shù)字人類體驗(yàn)中。NIM Tron SLM和LM Nim可以理解我們的意圖并協(xié)調(diào)其他模型。Riva語(yǔ)音Nim用于交互式語(yǔ)音和翻譯;音頻到面部和身體動(dòng)畫的面部和手勢(shì)Nim;以及Omniverse RTX與DLSS用于皮膚和頭發(fā)的神經(jīng)渲染。Nim運(yùn)行在NVIDIA GDM之上,這是一個(gè)全球性的NVIDIA加速基礎(chǔ)設(shè)施網(wǎng)絡(luò),為100多個(gè)地區(qū)提供低延遲的數(shù)字人類處理。
我們一直在研發(fā)AI GPU,為這一天做好準(zhǔn)備。原因很簡(jiǎn)單,我們一直都知道,要?jiǎng)?chuàng)建一個(gè)新的計(jì)算平臺(tái)事業(yè)部,首先需要一個(gè)已安裝的基礎(chǔ)。最終,應(yīng)用程序會(huì)隨之而來(lái)。如果你不創(chuàng)建已安裝的基礎(chǔ),應(yīng)用程序從何而來(lái)?因此,如果你建造它,它們可能會(huì)來(lái),但如果你不建造它,它們就一定不會(huì)來(lái)。因此,我們安裝了每個(gè)帶有張量核心處理的RTX GPU?,F(xiàn)在,我們?cè)谌驌碛?億個(gè)GeForce RTX AIPC。
在這次發(fā)布會(huì)上,我們展示了4款令人驚嘆的新筆記本電腦。它們都能夠運(yùn)行AI。你未來(lái)的筆記本電腦,你未來(lái)的電腦都將融入AI。它會(huì)不斷地幫助你,在后臺(tái)協(xié)助你。PC還將運(yùn)行由AI增強(qiáng)的應(yīng)用程序。當(dāng)然,你所有的照片編輯、寫作和工具,以及你使用的所有東西都將通過AI得到增強(qiáng)。你的電腦也將托管帶有數(shù)字人類的應(yīng)用程序。
AI將以不同的方式在個(gè)人電腦上呈現(xiàn)和使用,但個(gè)人電腦將成為一個(gè)非常重要的AI平臺(tái)。那么我們從這里走向哪里呢?我之前談到了我們數(shù)據(jù)中心的擴(kuò)展。每一次擴(kuò)展,當(dāng)我們從DGX擴(kuò)展到大型AI超級(jí)計(jì)算機(jī)時(shí),我們發(fā)現(xiàn)了一個(gè)新的拐點(diǎn),我們讓Transformer能夠在非常大的數(shù)據(jù)集上進(jìn)行訓(xùn)練。
嗯,一開始發(fā)生的事情是,數(shù)據(jù)是由人類監(jiān)督的。需要人工標(biāo)記來(lái)訓(xùn)練人工智能系統(tǒng)。不幸的是,人類標(biāo)簽的數(shù)量是有限的。Transformers使無(wú)監(jiān)督學(xué)習(xí)成為可能。現(xiàn)在,Transformers只需查看大量數(shù)據(jù)或查看大量視頻,或查看更大量的圖像,它們可以從研究大量數(shù)據(jù)中學(xué)習(xí),找到模式和關(guān)系本身。
雖然下一代AI需要基于物理,但今天大多數(shù)AI都不理解物理定律。它不是植根于物理世界,無(wú)法生成圖像、視頻、3D圖形和許多物理現(xiàn)象。我們需要基于物理并理解物理定律的AI。當(dāng)然,從視頻中學(xué)習(xí)是一個(gè)來(lái)源。另一種方式是合成數(shù)據(jù)、模擬數(shù)據(jù),另一種方式是使用計(jì)算機(jī)相互學(xué)習(xí)。這與使用AlphaGo沒有什么不同,讓AlphaGo自己玩自己的游戲,在這兩種能力之間,將相同的能力相互玩很長(zhǎng)一段時(shí)間,它們變得更加聰明。
你開始看到這種類型的AI崛起,如果任何數(shù)據(jù)都是合成生成并使用強(qiáng)化學(xué)習(xí),那么數(shù)據(jù)生成速度將繼續(xù)提高是合理的。每一次數(shù)據(jù)生成的增長(zhǎng),我們所提供的計(jì)算量也需要隨之增長(zhǎng)。我們即將進(jìn)入一個(gè)階段,在這里,AI可以學(xué)習(xí)物理和理解定律,并以物理世界的數(shù)據(jù)為基礎(chǔ),因此我們預(yù)計(jì)模型將繼續(xù)增長(zhǎng),我們需要更大的GPU。Blackwell就是為這一代人設(shè)計(jì)的。
這是Blackwell,擁有幾項(xiàng)非常重要的技術(shù)。當(dāng)然,這只是芯片的大小。我們拿了兩個(gè)最大的芯片,一個(gè)是TSMC所能做到的最大的芯片,我們將其中兩個(gè)連接在一起,每個(gè)第二個(gè)環(huán)節(jié)10TB,將世界上最先進(jìn)的GPU連接在一起。將這兩個(gè)連接在一起,然后我們將其中兩個(gè)放在一個(gè)計(jì)算機(jī)節(jié)點(diǎn)上,用一個(gè)Grace CPU連接它。
在訓(xùn)練情況下,Grace CPU可以用于幾件事情。它可以使用,它可以用于快速檢查點(diǎn)和在推理和生成的情況下重新啟動(dòng)。它可以用于存儲(chǔ)上下文記憶,以便AI具有記憶并理解我們想要的對(duì)話的上下文。這是我們的第二代Transformer引擎。Transformer引擎允許我們根據(jù)該計(jì)算層所需的精度和范圍動(dòng)態(tài)適應(yīng)較低的精度。這是我們的第二代GPU,具有安全的AI,因此您可以要求服務(wù)提供商保護(hù)您的AI免遭竊取、盜竊或篡改。這是我們的第五代NVLink。
NVLink允許我們將多個(gè)GPU連接在一起。這也是我們第一代具有可靠性和可用性引擎的產(chǎn)品。這個(gè)RAS系統(tǒng),允許我們測(cè)試每一個(gè)晶體管片上存儲(chǔ)器觸發(fā)器、片外存儲(chǔ)器,這樣我們就可以在現(xiàn)場(chǎng)確定某個(gè)芯片是否沒有MTBF。與此同時(shí),一臺(tái)擁有10000個(gè)GPU的超級(jí)計(jì)算機(jī)發(fā)生故障之間的間隔是以小時(shí)為單位測(cè)量的。超級(jí)計(jì)算機(jī)故障之間的時(shí)間間隔是100000個(gè)GPU的間隔。它以分鐘為單位測(cè)量。
如果我們不發(fā)明技術(shù)來(lái)增強(qiáng)其可靠性,超級(jí)計(jì)算機(jī)能夠長(zhǎng)期運(yùn)行并訓(xùn)練可能持續(xù)數(shù)月的模型的能力實(shí)際上是不可能的??煽啃援?dāng)然會(huì)增加正常運(yùn)行時(shí)間,這直接影響成本。最后,減壓。引擎數(shù)據(jù)處理是我們必須做的最重要的事情之一。我們添加了數(shù)據(jù)壓縮引擎解壓縮引擎,以便我們可以以比今天更快的速度20倍的速度從存儲(chǔ)中提取數(shù)據(jù)。
所有這些都代表了Blackwell。我們?cè)贕TC期間展示了Blackwell的原型。這是世界上有史以來(lái)最復(fù)雜、最高性能的計(jì)算機(jī)。這是灰色的CPU。這些是Blackwell模具,其中兩個(gè)連接在一起。
這是世界上最大的芯片。我們用10TB/s的NVLink將兩個(gè)GPU連接在一起。這使得Blackwell計(jì)算機(jī)的性能令人難以置信。我們?cè)诎四陜?nèi)將計(jì)算量和人工智能模型規(guī)模提高了一千倍。我們通過計(jì)算能力的提升降低了能耗。用于訓(xùn)練GPT-4的2萬(wàn)億參數(shù)、8萬(wàn)億token,能耗下降了350倍。以前用Pascal架構(gòu)需要1000吉瓦時(shí),這意味著需要一個(gè)千兆瓦的數(shù)據(jù)中心。世界上沒有千兆瓦的數(shù)據(jù)中心,即使有,訓(xùn)練也需要一個(gè)月的時(shí)間。
這就是為什么僅在八年前,我們通過不斷提高性能和能效來(lái)實(shí)現(xiàn)ChatGPT這樣的大型語(yǔ)言模型。如果一臺(tái)超級(jí)計(jì)算機(jī)有1萬(wàn)個(gè)GPU,平均無(wú)故障時(shí)間是1萬(wàn)小時(shí)。但現(xiàn)在是用分鐘來(lái)衡量的,所以一臺(tái)超級(jí)計(jì)算機(jī)要能夠運(yùn)行很長(zhǎng)一段時(shí)間,才能長(zhǎng)期訓(xùn)練一個(gè)模型。這就要求我們的技術(shù)非??煽浚荒苤袛噙\(yùn)行。持續(xù)運(yùn)行需要花費(fèi)很多時(shí)間和金錢。所以我們加入了數(shù)據(jù)壓縮和解壓縮引擎,讓數(shù)據(jù)訪問速度提高20倍。
四、展示Blackwell,劇透它的替代者
這就是Blackwell,我們這里有一個(gè)已經(jīng)在生產(chǎn)中的Blackwell。在GTC,我給大家看了Blackwell的原型。這就是我們正式生產(chǎn)的Blackwell,里面有最尖端的技術(shù)。這是我們實(shí)際生產(chǎn)的版本,可以說是功能和性能最強(qiáng)大的芯片。這是我們的CPU。每個(gè)裸晶包含兩個(gè)GPU,這可以說是世界上我們可以生產(chǎn)出來(lái)的最大的芯片。它兩個(gè)串聯(lián)起來(lái)的時(shí)候,連接的速度是10TB/s。Blackwell電腦的性能非常強(qiáng)大。
這是一個(gè)DGX Blackwell,氣冷式,里面有八個(gè)這樣的GPU??纯催@些GPU上的散熱片大小。大約15千瓦,完全氣冷式。這個(gè)版本支持x86,并且進(jìn)入了我們一直在運(yùn)輸?shù)腍opper基礎(chǔ)設(shè)施。但是,如果您想要液體冷卻,我們有一個(gè)新系統(tǒng)。這個(gè)新系統(tǒng)基于模塊化的MGX。這是兩個(gè)Blackwell板。所以這個(gè)節(jié)點(diǎn)有四個(gè)Blackwell芯片,這是一個(gè)兩層的系統(tǒng)。九個(gè)這樣的節(jié)點(diǎn)加在一起,總共有72個(gè)GPU,用新的NVLink連接在一起。這是我們的NVLink交換器,是我們第五代NVLink產(chǎn)品。
NVLink交換器可以說是科技上的一種奇跡,它的數(shù)據(jù)傳輸速率真的太快了。
如果把所有Blackwell芯片串聯(lián)在一起,就可以有一個(gè)72個(gè)GPU的Blackwell系統(tǒng)。這樣做的好處是,在每個(gè)GPU的領(lǐng)域中,看起來(lái)就像一個(gè)GPU,但實(shí)際上有72個(gè)。與上一代相比,數(shù)量是9倍,帶寬是18倍,浮點(diǎn)運(yùn)算能力是45倍,但功耗只有10倍。這是一個(gè)100千瓦的系統(tǒng),之前是10千瓦。當(dāng)然你可以把更多的芯片串聯(lián)在一起。
為什么說NVLink芯片是一個(gè)科技上的奇跡呢?
因?yàn)镹VLink把所有芯片串聯(lián)在一起,大型語(yǔ)言模型不能只有一個(gè)節(jié)點(diǎn),不能只有一個(gè)GPU。我們必須把整個(gè)機(jī)架里頭所有的GPU全部都連接在一起,這樣才能有一個(gè)可以處理十兆參數(shù)以上的大型語(yǔ)言模型。它有500億個(gè)晶體管,72個(gè)端口,4個(gè)NVLink,每秒速度是1.8TB。
這就是我們現(xiàn)在的DGX。很多人都在問我們,NVIDIA到底是做什么的,為什么單憑GPU就能變得這么大?這就是GPU,這可以說是世界上最先進(jìn)的GPU,不過這是打電話用的GPU。我旁邊的這個(gè)也是一個(gè)GPU,各位女士,各位先生,這就是我們的DGX,GPU跟過去已經(jīng)截然不同了。
這個(gè)GPU的后面就是NVLink所組成的一個(gè)背板。這個(gè)背板當(dāng)中有5000條線,加起來(lái)有兩英里這么長(zhǎng)。這就是我們所謂的NVLink背板,可以連接72個(gè)GPU。把70個(gè)GPU連接在一起,這可以說是在電機(jī)學(xué)上面的一種奇跡。它通過銅線讓NVLink交換器,透過背板當(dāng)中的銅線,讓我們一個(gè)機(jī)架可以節(jié)省20千瓦。我們可以把節(jié)省下來(lái)的20千瓦用來(lái)進(jìn)行數(shù)據(jù)處理,這就是NVLink背板。
我們要打造AI工廠,所以我們必須要有更高速的網(wǎng)絡(luò)技術(shù)。我們有兩種InfiniBand。第一種InfiniBand用在AI工廠和超級(jí)電腦當(dāng)中,而且它成長(zhǎng)的速度非常的快??墒遣⒉皇敲總€(gè)資料中心都可以用InfiniBand,因?yàn)樗麄円郧耙呀?jīng)采用了以太網(wǎng)絡(luò)了。實(shí)際上,管理InfiniBand是需要一些特別的技術(shù)。因此我們就把InfiniBand的一些功能,放到以太網(wǎng)絡(luò)的架構(gòu)當(dāng)中。這其實(shí)非常的困難,為什么呢?
道理很簡(jiǎn)單。以太網(wǎng)絡(luò)當(dāng)初設(shè)計(jì)的時(shí)候,它是針對(duì)平均傳輸量比較高的系統(tǒng)。每個(gè)電腦、每個(gè)節(jié)點(diǎn)都是連接到一個(gè)不同的人,大部分是資料中心跟另外一端的人在進(jìn)行溝通??墒茿I工廠當(dāng)中的深度學(xué)習(xí)系統(tǒng)GPU并不是跟人來(lái)做溝通。GPU是他們彼此之間在做溝通,因?yàn)樗麄冊(cè)谑占瘮?shù)據(jù),也就是把產(chǎn)品的部分?jǐn)?shù)據(jù)收集起來(lái),然后進(jìn)行縮減,然后再重新的來(lái)進(jìn)行分配。所以重點(diǎn)不是平均的傳輸量,而是最后一個(gè)接收到信息的那個(gè)GPU。
因?yàn)槟闶菑拿總€(gè)人那邊去收集一些資料,看誰(shuí)的速度最慢。這個(gè)系統(tǒng)的速度就決定于哪一個(gè)人給資料的時(shí)候速度最慢。那個(gè)人就決定了這樣的一個(gè)速度。過去以太網(wǎng)絡(luò)是辦不到的,所以我們必須要有端到端的架構(gòu)。這當(dāng)中有四個(gè)不同的技術(shù)。NVIDIA有世界上最先進(jìn)的NVLink和RDMA。
RDMA是專門針對(duì)以太網(wǎng)絡(luò)所做的設(shè)計(jì)。除此之外,我們還有擁塞控制系統(tǒng),它很快的在處理這些參數(shù)的數(shù)值。每次假如有任何GPU送出太多的資料,我們就叫他們慢一點(diǎn),這樣才不會(huì)產(chǎn)生瓶頸。第三個(gè)就是自適應(yīng)路由,以太網(wǎng)絡(luò)必須要傳送和接收資料的時(shí)候,必須要按順序來(lái)。假如我們看到有任何端口沒有使用,或者是有塞車的情形,我們就把這個(gè)信息送到?jīng)]有使用的端口,這樣我們就可以把工作的順序重新安排好。
還有一個(gè)很重要,就是流量隔離。因?yàn)槲覀冊(cè)谟?xùn)練的模組不止一個(gè),所以資料中心里頭一定都會(huì)有一些其他流量。一旦進(jìn)入我們的工作流程當(dāng)中,就會(huì)產(chǎn)生噪音。這樣就會(huì)影響數(shù)據(jù)傳遞的速度,就會(huì)使訓(xùn)練的速度變慢。我們已經(jīng)打造了一個(gè)50億或者30億美金造價(jià)的資料中心來(lái)做訓(xùn)練。假如網(wǎng)絡(luò)的利用率降低40%,培訓(xùn)時(shí)間延長(zhǎng)了20%,那么50億美元的數(shù)據(jù)中心實(shí)際上花費(fèi)了60億美元。因此成本影響相當(dāng)大。
使用Spectrum-X以太網(wǎng)基本上允許我們大大提高性能,因此網(wǎng)絡(luò)基本上是免費(fèi)的。所以這真的是一個(gè)相當(dāng)大的成就。我們非常,我們擁有完整的以太網(wǎng)產(chǎn)品管道。這是Spectrum-X 800,它是51.2 Tb每秒和256個(gè)端口。
接下來(lái)即將到來(lái)的是512端口的Spectrum-X,即一年之后的Spectrum-X 800 Ultra。之后的那個(gè)是X 1600。重要的是,X 800是為成千上萬(wàn)個(gè)GPU設(shè)計(jì)的,X 800 Ultra也是為成千上萬(wàn)個(gè)GPU設(shè)計(jì)的,而X 1600是為數(shù)百萬(wàn)個(gè)GPU而設(shè)計(jì)的。數(shù)百萬(wàn)GPU數(shù)據(jù)中心的日子即將到來(lái)。
原因很簡(jiǎn)單。當(dāng)我們希望訓(xùn)練更大的模型時(shí),在未來(lái),幾乎你與互聯(lián)網(wǎng)或計(jì)算機(jī)的每次互動(dòng)都可能在云端運(yùn)行生成式AI。生成式AI正在與你合作,與你互動(dòng),生成視頻、圖像或文本,或者可能是數(shù)字人。因此,你幾乎一直在與計(jì)算機(jī)進(jìn)行交互,并且總是有一個(gè)生成式AI與之相連。有些在本地,有些在你的設(shè)備上,其中很多可能在云端。
這些生成式AI還將具有大量的推理能力,而不僅僅是一次性答案,它們可能會(huì)對(duì)答案進(jìn)行迭代,以便在將答案提供給您之前提高答案的質(zhì)量。因此,未來(lái)我們將要處理的生成內(nèi)容的數(shù)量將是非凡的。
讓我們現(xiàn)在來(lái)看看今晚所有這些,這是我們的第一個(gè)夜間主題演講。你不能在早上的主題演講中這樣做。我認(rèn)為這種基調(diào)風(fēng)格在Computex中從未做過,可能是最后一次。只有媒體才能做到這一點(diǎn),只有我能做到。當(dāng)然,Blackwell是最初推出的第一代媒體平臺(tái)。
正如世界所知,生成式AI時(shí)代已經(jīng)到來(lái)。正如世界意識(shí)到AI工廠的重要性一樣,正如這場(chǎng)新工業(yè)革命的開始。我們有如此多的支持者,幾乎每個(gè)OEM、每個(gè)計(jì)算機(jī)制造商、每個(gè)CSP、每個(gè)GPU云、主權(quán)云,甚至電信公司,世界各地的企業(yè),成功的數(shù)量,采用率,對(duì)Blackwell的熱情程度都非常令人興奮。我想為此感謝大家。
我們不會(huì)止步于此。在這個(gè)令人難以置信的增長(zhǎng)時(shí)期,我們希望確保繼續(xù)提高性能,繼續(xù)降低成本,包括培訓(xùn)成本、推理成本,并繼續(xù)擴(kuò)展AI能力,以使每家公司都能接受。我們走的越遠(yuǎn),性能越強(qiáng),成本下降就越大。當(dāng)然,Hopper平臺(tái)可能是歷史上最成功的數(shù)據(jù)中心處理器。這只是一個(gè)令人難以置信的成功故事。
然而,Blackwell就在這里,正如你所注意到的,每個(gè)平臺(tái)都有幾件事情。你有CPU,有GPU,有NVLink,有NIC,還有這個(gè)交換器。NVLink交換器會(huì)把所有的GPU連接在一起,把它變成一個(gè)最大的領(lǐng)域。我們因此可以用非常高速的交換器。但其實(shí)它是一整個(gè)平臺(tái),我們打造一整個(gè)平臺(tái),我們把整平臺(tái)整合成一個(gè)AI工廠的超級(jí)電腦,我們?cè)侔阉稚?,讓全世界都可以使用?/p>
在座各位都有能力去創(chuàng)造非常有趣、非常有創(chuàng)意的一個(gè)設(shè)置配置,可以用不同的風(fēng)格,不同的數(shù)據(jù)中心,不同的顧客。你們可以在不同的地方,不同的邊緣,甚至是有一些是電商等等。所以我們盡量讓它有彈性,讓大家可以有最有創(chuàng)意的方式來(lái)進(jìn)行建構(gòu)。
關(guān)于Blackwell平臺(tái),我們公司按照一年一個(gè)的節(jié)奏推出。我們的基本理念非常簡(jiǎn)單,我們要建立整個(gè)數(shù)據(jù)中心,再將它分解,并以一年的節(jié)奏部分賣給用戶。我們將一切推向技術(shù)極限。無(wú)論是什么TSMC工藝,技術(shù)都會(huì)把它推向絕對(duì)極限,無(wú)論是什么封裝技術(shù),都將它推向絕對(duì)極限,無(wú)論是什么存儲(chǔ)技術(shù),都將它推向絕對(duì)極限,無(wú)論是網(wǎng)絡(luò)技術(shù),光學(xué)技術(shù),一切都將被推向極限。
然后在那之后,以這樣的方式做所有事情,以便我們所有的軟件都能在整個(gè)安裝的基礎(chǔ)上運(yùn)行。軟件慣性是計(jì)算機(jī)中最重要的事情。當(dāng)計(jì)算機(jī)向后兼容并且在架構(gòu)上與已經(jīng)創(chuàng)建的所有軟件兼容時(shí),您進(jìn)入市場(chǎng)的能力將更快。因此,當(dāng)我們可以利用整個(gè)軟件安裝基礎(chǔ)時(shí),速度是令人難以置信的。這就是我們?cè)贐lackwell在場(chǎng)時(shí)所創(chuàng)造的一切。
明年我們將推出Blackwell Ultra,就像我們有H-100和H-200一樣,你可能會(huì)看到我們的一些非常令人興奮的新一代,Blackwell Ultra再次挑戰(zhàn)極限,推出我提到的下一代Spectrum交換器。
下一個(gè)是我們的另一個(gè)開發(fā)平臺(tái),代號(hào)Rubin。我不會(huì)用太長(zhǎng)時(shí)間介紹Rubin,大家肯定會(huì)拍照來(lái)看細(xì)節(jié)內(nèi)容。我們有了Rubin平臺(tái),一年后我們會(huì)有Rubin Ultra平臺(tái)。到時(shí)候所有的產(chǎn)品都將會(huì)百分百兼容。
過去的12年里,從ImageNet讓我們意識(shí)到計(jì)算的未來(lái)將發(fā)生根本性變化,到今天,就像2012年之前的早期GeForce和今天的NVIDIA一樣,這家公司確實(shí)發(fā)生了巨大的變化。我要感謝所有在這里支持我們每一步的合作伙伴。
五、機(jī)器人與數(shù)字孿生及其他
接下來(lái),我想談?wù)勏乱徊ˋI浪潮——物理AI,即理解物理定律的AI。
AI可以在我們之間工作,因此它們必須理解世界模型,以便解釋和感知世界。當(dāng)然,它們還必須具備出色的認(rèn)知能力,這樣才能理解我們的要求,并在未來(lái)執(zhí)行任務(wù)。
機(jī)器人技術(shù)是一個(gè)更普遍的概念。當(dāng)我說機(jī)器人時(shí),通常指人形機(jī)器人,但事實(shí)并非如此。所有的工廠都將是機(jī)器人員工,工廠將安排機(jī)器人工作,這些機(jī)器人將建造機(jī)器人產(chǎn)品,并與機(jī)器人互動(dòng)。為了實(shí)現(xiàn)這一點(diǎn),我們需要取得一些突破。
總有一天,所有移動(dòng)的東西都將是自主的。世界各地的研究人員和公司正在開發(fā)由物理人工智能驅(qū)動(dòng)的機(jī)器人。物理AI是能夠理解指令的模型,一個(gè)自主機(jī)器人在現(xiàn)實(shí)世界中執(zhí)行復(fù)雜的任務(wù)。多模態(tài)大型語(yǔ)言模型是使機(jī)器人能夠?qū)W習(xí)、感知和理解周圍世界,并持續(xù)突破、計(jì)劃如何行動(dòng)的關(guān)鍵。
機(jī)器人現(xiàn)在可以學(xué)習(xí)使用粗略和精細(xì)的運(yùn)動(dòng)技能與世界互動(dòng)。推進(jìn)機(jī)器人技術(shù)的一項(xiàng)重要技術(shù)是強(qiáng)化學(xué)習(xí),就像大型語(yǔ)言模型需要從人類反饋中獲取RLHF(Reinforcement Learning from Human Feedback,即基于人類反饋的強(qiáng)化學(xué)習(xí))來(lái)學(xué)習(xí)特定技能一樣,物理AI可以利用模擬世界中的物理反饋強(qiáng)化學(xué)習(xí)來(lái)學(xué)習(xí)技能。這些模擬環(huán)境是機(jī)器人通過在遵循物理定律的虛擬世界中執(zhí)行行動(dòng)來(lái)學(xué)習(xí)決策的地方。機(jī)器人可以學(xué)習(xí)復(fù)雜而安全的日常任務(wù),并通過數(shù)百萬(wàn)次的嘗試和行動(dòng)來(lái)完善他們的技能。
在操作系統(tǒng)上,典型的AI模擬并重新創(chuàng)建。
這是一種發(fā)展嗎?
世界模擬結(jié)合了實(shí)時(shí)、基于Omniverse的物理模擬和生成式AI技術(shù)。機(jī)器人可以學(xué)習(xí)如何成為機(jī)器人,他們學(xué)習(xí)如何自主操縱物體,例如抓取和處理物體,或自主導(dǎo)航環(huán)境,在避開障礙物的同時(shí)找到最佳路徑。在Omniverse中學(xué)習(xí),將模擬與現(xiàn)實(shí)的差距最小化,最大化學(xué)習(xí)行為的遷移。
建造具有這種能力的機(jī)器人需要三臺(tái)英偉達(dá)AI超級(jí)計(jì)算機(jī)來(lái)訓(xùn)練模型。因此,我們推出了NVIDIA Omniverse,讓機(jī)器人可以學(xué)習(xí)和完善他們的技能。我們構(gòu)建開發(fā)人員和公司所需的平臺(tái)、加速庫(kù)和AI模型,并允許他們使用。
對(duì)他們來(lái)說,這就是下一波人工智能機(jī)器人的浪潮,人工智能的時(shí)代和工業(yè)革命。
我們有幾種方式來(lái)服務(wù)市場(chǎng)。
首先,我們將為每種類型的機(jī)器人系統(tǒng)創(chuàng)建平臺(tái),一個(gè)用于機(jī)器人工廠和倉(cāng)庫(kù),一個(gè)用于操縱事物的機(jī)器人,一個(gè)用于移動(dòng)的機(jī)器人,一個(gè)用于人形機(jī)器人。這些機(jī)器人平臺(tái)包括計(jì)算機(jī)加速庫(kù)和預(yù)訓(xùn)練模型,我們測(cè)試一切,訓(xùn)練一切,整合一切。
這里是機(jī)器人學(xué)習(xí)如何成為機(jī)器人的地方。當(dāng)然,現(xiàn)在機(jī)器人倉(cāng)庫(kù)的生態(tài)系統(tǒng)真的非常復(fù)雜。需要很多公司、很多工具、很多技術(shù)來(lái)建造一個(gè)現(xiàn)代化的倉(cāng)庫(kù)。倉(cāng)庫(kù)越來(lái)越趨向自動(dòng)化,直到某一天將會(huì)完全自動(dòng)化。因此,在每個(gè)生態(tài)系統(tǒng)中,我們都有SDKs和APIs連接到軟件行業(yè),SDKs和APIs連接到邊緣AI行業(yè)和公司。當(dāng)然,還有為PLC設(shè)計(jì)的系統(tǒng)和用于ODM的機(jī)器人系統(tǒng)。然后由集成商集成,最終為客戶建立倉(cāng)庫(kù)。
工廠擁有完全不同的生態(tài)系統(tǒng),富士康正在建造一些世界上最先進(jìn)的工廠。他們的生態(tài)系統(tǒng)包括用于設(shè)計(jì)工廠、工作流程、為機(jī)器人編程的邊緣計(jì)算機(jī)和機(jī)器人軟件,當(dāng)然還有協(xié)調(diào)數(shù)字工廠和人工智能工廠的PLC計(jì)算機(jī)。我們也有連接到每個(gè)生態(tài)系統(tǒng)的SDKs。這正在各地發(fā)生。富士康已經(jīng)建立了他們工廠的數(shù)字孿生,Delta也正在建立他們工廠的數(shù)字孿生。
Pigatron正在建立他們的機(jī)器人工廠的數(shù)字孿生,Wistron也正在建立他們的機(jī)器人工廠的數(shù)字孿生。這真的很酷。讓我們來(lái)看一看富士康新工廠的視頻。隨著世界將傳統(tǒng)數(shù)據(jù)中心現(xiàn)代化為生成式AI工廠,對(duì)英偉達(dá)加速計(jì)算的需求正在飆升。富士康,世界上最大的電子產(chǎn)品制造商,正準(zhǔn)備通過使用英偉達(dá)Omniverse構(gòu)建機(jī)器人工廠來(lái)滿足這一需求。
霓虹燈工廠規(guī)劃人員使用Omniverse來(lái)整合來(lái)自領(lǐng)先行業(yè)應(yīng)用程序(如西門子Teamcenter)的設(shè)施和設(shè)備數(shù)據(jù),這些數(shù)據(jù)在數(shù)字孿生中得到充分利用。他們優(yōu)化了地板布局和線路配置,并找到最佳的攝像頭放置位置,以使用英偉達(dá)Metropolis的視覺AI監(jiān)控未來(lái)的運(yùn)營(yíng)。虛擬集成為規(guī)劃人員節(jié)省了施工期間物理變更單的巨大成本。富士康團(tuán)隊(duì)使用數(shù)字孿生作為真相的來(lái)源,以溝通和驗(yàn)證準(zhǔn)確的設(shè)備布局。
Omniverse數(shù)字孿生也是機(jī)器人訓(xùn)練館,在這里,富士康開發(fā)人員培訓(xùn)和測(cè)試Nvidia Isaac AI應(yīng)用程序,用于機(jī)器人感知和操作,以及Metropolis AI應(yīng)用程序,用于Omniverse中的傳感器融合。富士康在將運(yùn)行時(shí)部署到裝配線上的Judson計(jì)算機(jī)之前,模擬了2個(gè)機(jī)器人AI。他們模擬了用于物體識(shí)別、缺陷檢測(cè)和軌跡規(guī)劃的自動(dòng)光學(xué)檢測(cè)的Isaac機(jī)械手庫(kù)和AI模型。
為了轉(zhuǎn)移到測(cè)試機(jī)器人,他們模擬Isaac感知器驅(qū)動(dòng)的Farab AMR,他們通過3D映射和重建感知并在環(huán)境中移動(dòng)。富士康建造了他們的機(jī)器人工廠,這些工廠協(xié)調(diào)運(yùn)行在Nvidia Isaac上的機(jī)器人,以構(gòu)建視頻AI 2計(jì)算機(jī),從而控制起重機(jī)Vox。所以一個(gè)機(jī)器人工廠設(shè)計(jì)有三臺(tái)計(jì)算機(jī):在Nvidia AI上訓(xùn)練AI,讓機(jī)器人在PLC系統(tǒng)上運(yùn)行,以協(xié)調(diào)工廠,然后,當(dāng)然,你在Omniverse中模擬一切。
機(jī)械手臂和機(jī)器人的AMRs也是一樣的,三個(gè)計(jì)算機(jī)系統(tǒng),不同之處在于兩個(gè)Omniverse將會(huì)結(jié)合在一起。所以這些共享一個(gè)虛擬空間。當(dāng)他們共享一個(gè)虛擬空間時(shí),這個(gè)機(jī)械手臂將進(jìn)入機(jī)器人工廠。
再一次,三臺(tái)計(jì)算機(jī),我們?yōu)橛?jì)算機(jī)提供加速層和預(yù)訓(xùn)練的AI模型。我們已經(jīng)將Nvidia的機(jī)械手和Nvidia Omniverse與世界領(lǐng)先的工業(yè)自動(dòng)化軟件和系統(tǒng)公司西門子連接起來(lái)。這真的是一個(gè)非常棒的合作關(guān)系。
他們?cè)谑澜绺鞯氐墓S工作。語(yǔ)義拾取AI現(xiàn)在集成了Isaac機(jī)械手和語(yǔ)義拾取AI運(yùn)行,操作ABB、KUKA、Yaskawa、FANUC、Universal Robots和Techman。
我們還有各種其他的集成,例如,Arcbest正在將Isaac感知器集成到Foxx智能自主機(jī)器人中,以增強(qiáng)物體識(shí)別和人類運(yùn)動(dòng)跟蹤。電子產(chǎn)品的運(yùn)動(dòng)跟蹤和材料處理正在將Isaac操縱器和感知器集成到他們的人工智能機(jī)器人中,以提高全球制造效率。
Idealworks正在將Isaac感知器構(gòu)建到他們的iWMS軟件中,用于工廠物流內(nèi)在的AI機(jī)器人。Kivnon正在整合Isaac感知器,以推進(jìn)AI驅(qū)動(dòng)的運(yùn)動(dòng),以推進(jìn)AI啟用的物流。Argo機(jī)器人正在將Isaac感知器應(yīng)用于基于高級(jí)視覺的感知引擎中。Solomon在他們的AcuPick中使用Isaac操縱器AI模型。
Tattile機(jī)器人正在將Isaac Sim和機(jī)械手引入TMF Web加速自動(dòng)光學(xué)檢測(cè)。Teradyne機(jī)器人正在將Isaac機(jī)械手集成到協(xié)作機(jī)器人的PolyScope X中,并將Isaac感知器集成到MiR AMRs中。Mech-Mind正在將Isaac操作器集成到Mech-Eye工業(yè)3D相機(jī)中,用于AI操作機(jī)器人。
機(jī)器人來(lái)了,物理AI在這里。
這不是科幻小說,它正在各地使用,真的非常令人興奮。那就是工廠,里面的機(jī)器人,所有的產(chǎn)品都將是機(jī)器人。
其中之一是自動(dòng)駕駛汽車或具有大量自主能力的汽車。英偉達(dá)再次構(gòu)建整個(gè)堆棧。明年,我們將與奔馳車隊(duì)一起投入生產(chǎn)。
之后,在2026年,我們向全世界提供完整的JLR艦隊(duì)堆棧。但是,歡迎您取用我們堆棧的任何部分或任何層,就像整個(gè)驅(qū)動(dòng)器堆棧打開一樣。下一個(gè)大批量機(jī)器人產(chǎn)品將由機(jī)器人工廠制造,內(nèi)部有機(jī)器人,可能是人形機(jī)器人。
近年來(lái),由于基礎(chǔ)模型的出現(xiàn),這在認(rèn)知的能力和我們正在開發(fā)的世界理解能力方面都有了很大的進(jìn)步。我對(duì)這個(gè)領(lǐng)域感到非常興奮,最容易適應(yīng)這個(gè)世界的機(jī)器人是人類機(jī)器人,因?yàn)槲覀優(yōu)槲覀兘ㄔ炝诉@個(gè)世界。
我們還需要比其他類型的機(jī)器人更大量的數(shù)據(jù)來(lái)訓(xùn)練這些機(jī)器人,因?yàn)槲覀儞碛邢嗤纳韺W(xué)。訓(xùn)練數(shù)據(jù),我們可以通過演示功能和視頻功能提供,這將是非常棒的。
因此,我們將在這個(gè)領(lǐng)域看到很多進(jìn)展。事實(shí)證明,這項(xiàng)技術(shù)與當(dāng)今已經(jīng)構(gòu)建的所有其他計(jì)算機(jī)的構(gòu)建技術(shù)非常相似。所以這對(duì)我們來(lái)說將是一段非常非凡的旅程。
本文由人人都是產(chǎn)品經(jīng)理作者【硅星人】,微信公眾號(hào):【硅星人Pro】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自黃仁勛演講現(xiàn)場(chǎng)照片
- 目前還沒評(píng)論,等你發(fā)揮!