在线观看免费人成视频久网,天堂av中文字幕乱码免费看

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

黃仁勛：英偉達(dá)將一年推一款全新芯片，沒有英偉達(dá)就沒有今天AI的一切（附最新演講全文）

硅星人

2024-06-04

0 評(píng)論 1638 瀏覽 2 收藏

76 分鐘

英偉達(dá)是今天生成式AI浪潮里最大的贏家，而黃仁勛要告訴世界，這一切跟運(yùn)氣無(wú)關(guān)，是英偉達(dá)預(yù)見并用實(shí)力創(chuàng)造了今天的一切。

6月2日晚，英偉達(dá)創(chuàng)始人和CEO黃仁勛在COMPUTEX開幕前發(fā)表了最新的主題演講，距離上一場(chǎng)在GTC上的重磅發(fā)布會(huì)僅僅三個(gè)月后，這場(chǎng)發(fā)布會(huì)依然干貨滿滿，甚至驚喜不斷。

除了更系統(tǒng)全面的梳理和展示了英偉達(dá)在加速計(jì)算和生成式AI上的最新成果，黃仁勛還劇透了下一代GPU架構(gòu)——

是的，“史上最強(qiáng)”的Blackwell剛剛公布三個(gè)月，而且還沒有開始量產(chǎn)發(fā)貨，下一代就在路上了。

黃仁勛表示，2025年英偉達(dá)會(huì)推出Blackwell Ultra，而2026年下一代架構(gòu)名字為Rubin，2027年繼續(xù)推出Rubin Ultra。

一年一款大更新，這節(jié)奏，已經(jīng)趕上手機(jī)廠商的發(fā)布節(jié)奏。

而且，這些大更新會(huì)繼續(xù)把推理成本指數(shù)級(jí)的打下來(lái)。這個(gè)路線圖的劇透，就像是黃式定律在秀肌肉。

一切盡在掌握。你們盡管買英偉達(dá)的卡就行了。

而在演講中，黃仁勛梳理英偉達(dá)從GPU，到CUDA，到最新的NIM，再到機(jī)器人和數(shù)字孿生平臺(tái)的一系列產(chǎn)品線的歷史時(shí)，明顯的改變了講述風(fēng)格。

黃仁勛形容英偉達(dá)早就看到了CPU的瓶頸，因而走了GPU和加速計(jì)算的路——過往提到英偉達(dá)GPU產(chǎn)品線的誕生他還總是會(huì)謙虛，而業(yè)內(nèi)也總是把GPU形容為碰巧適合人工智能計(jì)算需求的芯片。但今天黃仁勛給出的因果關(guān)系變了。

“CUDA是英偉達(dá)和人工智能的第一次親密接觸。而那之后我們深入理解深度學(xué)習(xí)的本質(zhì)，有意識(shí)的重新發(fā)明了一切。改變了GPU架構(gòu)，增加Tensor核，發(fā)明NV link，推出cuDNN，TensorRT，Nickel，收購(gòu)Mellanox推出Triton等等。”這是英偉達(dá)的新敘事。

而其中，CUDA被黃仁勛大夸特夸?！叭绻麤]有我們精心打造的打造的各類特定領(lǐng)域的庫(kù)，全球深度學(xué)習(xí)科學(xué)家們就無(wú)法充分利用潛力。CUDA就像OpenGL之于計(jì)算機(jī)圖形學(xué)，SQL之于數(shù)據(jù)分析?！彼f。

“一個(gè)新的開發(fā)平臺(tái)和擁有大量的開發(fā)者，這是個(gè)雞生蛋的問題。它很少被打破。而我們把它打破了。我們花了20年的時(shí)間，一個(gè)個(gè)的域庫(kù)，一個(gè)個(gè)加速庫(kù)的做，現(xiàn)在我們擁有500萬(wàn)開發(fā)人員。”黃仁勛不再需要謙虛。“CUDA已經(jīng)到了一個(gè)臨界點(diǎn)，開始實(shí)現(xiàn)良性循環(huán)?！?/p>

黃仁勛在演講里，干脆不藏著掖著了，他把英偉達(dá)定義為今天世界上生成式AI浪潮的來(lái)源。

“人工智能崛起之所以有可能，完全因?yàn)槲覀兿嘈胖灰審?qiáng)大的計(jì)算變得越來(lái)越便宜，總會(huì)有人找到巨大的用途?！彼f?！罢?yàn)槲覀兝锰囟ㄋ惴▽⒂?jì)算邊際成本降低了100萬(wàn)級(jí)別，今天使用互聯(lián)網(wǎng)上的所有數(shù)據(jù)來(lái)訓(xùn)練大模型才成為了所有人默認(rèn)合乎邏輯的選擇，不再有人懷疑和質(zhì)疑這個(gè)做法?！?/p>

而在英偉達(dá)這么做之前，“沒有人預(yù)料到，沒有人提出這樣的需求。甚至沒有人理解全部潛力?！?/p>

在這場(chǎng)演講里，黃仁勛也不時(shí)說幾句中文。他給token提供了一個(gè)翻譯：詞元。

“今天我們可以為任何有價(jià)值的事物生成它的token。就像特斯拉發(fā)明交流電機(jī)給我們不斷產(chǎn)生電子，英偉達(dá)發(fā)明的是人工智能生成器，在不斷產(chǎn)生token。”

一切都與token有關(guān)，而英偉達(dá)制造和掌握了這一切。

以下為這場(chǎng)發(fā)布會(huì)的核心要點(diǎn)和全文實(shí)錄。

核心要點(diǎn)整理：

新的架構(gòu)路線圖：2025年是Blackwell Ultra，2026年會(huì)有新架構(gòu)Rubin，2027年則是Rubin Ultra。
我們現(xiàn)在所處的不是AI時(shí)代，而是一個(gè)生成式AI時(shí)代。
幾乎世界萬(wàn)物都可以轉(zhuǎn)換成Token（詞元）。
價(jià)值3萬(wàn)億美元的IT產(chǎn)業(yè)將成為 AI 工廠，為每個(gè)行業(yè)制作 AI 產(chǎn)品。
我們需要基于物理并理解物理定律的AI。
每個(gè)裝有 RTX 顯卡的 PC，都是 AIPC。
CUDA不僅達(dá)到了重要的成熟階段，還進(jìn)入了一個(gè)自我強(qiáng)化的良性循環(huán)，不斷提升其性能和應(yīng)用價(jià)值。
隨著CPU性能增長(zhǎng)放緩，利用CUDA等技術(shù)加速計(jì)算任務(wù)是應(yīng)對(duì)計(jì)算需求指數(shù)級(jí)增長(zhǎng)的關(guān)鍵策略，未來(lái)所有處理密集型應(yīng)用和數(shù)據(jù)中心都將采用這一策略以保持效率和成本效益。
這 60 年來(lái)，我們只見證了兩三次主要的技術(shù)變革，如今生成式 AI 使我們得以再次見證一次技術(shù)變革。

以下為全文實(shí)錄：

大家好！很高興再次來(lái)到這里。今晚我將在此舉辦一場(chǎng)“Don’t Walk”演講。因?yàn)槲覀円務(wù)摰氖虑楹芏?，時(shí)間緊迫，所以不能慢慢走，得用跑的。

今晚我將談?wù)撘韵聨讉€(gè)方面：

當(dāng)前的行業(yè)動(dòng)態(tài)、我們正在共同努力的方向是什么？
什么是生成式AI、它對(duì)我們及各行各業(yè)的影響？
以及我們將如何把握這個(gè)難得的機(jī)遇。接下來(lái)會(huì)發(fā)生什么？
生成式AI及其影響、我們的藍(lán)圖以及未來(lái)的展望。這些都是令人無(wú)比興奮的時(shí)刻。

一、重新梳理英偉達(dá)的歷史：沒有英偉達(dá)就沒有今天AI的一切

英偉達(dá)目前正處于計(jì)算機(jī)圖形模擬的交叉點(diǎn)上，這是我們的靈魂所在。我今天展示的一切都是模擬，是數(shù)學(xué)，是科學(xué)，是計(jì)算機(jī)科學(xué)，是令人驚嘆的計(jì)算機(jī)體系結(jié)構(gòu)。所有內(nèi)容都不是動(dòng)畫制作的。這是英偉達(dá)的靈魂，我們把所有東西都放在了這個(gè)我們稱之為“Omniverse”的虛擬世界中。

你所看到的一切都基于兩項(xiàng)基本技術(shù)：加速計(jì)算和人工智能。這兩種技術(shù)將重塑計(jì)算機(jī)行業(yè)。計(jì)算機(jī)行業(yè)從誕生至今已有60年的歷史。從很多方面來(lái)看，我們今天所做的一切都源于1964年，IBM System 360在那一年發(fā)明，引入了中央處理單元、通用計(jì)算，并通過操作系統(tǒng)實(shí)現(xiàn)了軟硬件分離。

多任務(wù)處理、I/O、子系統(tǒng)、DMA，我們今天使用的各種技術(shù)、架構(gòu)兼容性、向后兼容性以及我們今天所知道的關(guān)于計(jì)算的一切，主要是在1964年后誕生的。當(dāng)然，PC革命使計(jì)算民主化，并將其掌握在每個(gè)人手中。2007年，iPhone推出了移動(dòng)計(jì)算功能，并將電腦放進(jìn)了我們的口袋。從那時(shí)起，一切都通過移動(dòng)云始終連接和運(yùn)行。

在過去的60年里，我們看到兩三個(gè)主要的技術(shù)轉(zhuǎn)變，兩三個(gè)計(jì)算領(lǐng)域的結(jié)構(gòu)性轉(zhuǎn)變，一切都發(fā)生了變化。而這種情況即將再次發(fā)生。

第一個(gè)問題是處理器，計(jì)算機(jī)行業(yè)在中央處理單元上運(yùn)行的引擎，其性能擴(kuò)展已經(jīng)大大放緩。

然而，我們需要的計(jì)算量仍然以指數(shù)級(jí)的速度翻倍。如果我們需要處理的數(shù)據(jù)繼續(xù)呈指數(shù)級(jí)增長(zhǎng)，但性能卻沒有，我們將經(jīng)歷計(jì)算膨脹。事實(shí)上，就在我們說話的時(shí)候，世界各地的數(shù)據(jù)中心電力數(shù)量正在大幅增長(zhǎng)，計(jì)算機(jī)的成本也在不斷增長(zhǎng)。我們看到了計(jì)算通貨膨脹。

當(dāng)然，這種情況無(wú)法繼續(xù)，數(shù)據(jù)將繼續(xù)呈指數(shù)級(jí)增長(zhǎng)，而CPU性能擴(kuò)展永遠(yuǎn)不會(huì)恢復(fù)。近二十年來(lái)，我們一直致力于加速計(jì)算，利用CUDA增強(qiáng)CPU，卸載和加速專用處理器可以做得更好的工作。現(xiàn)在很明顯，隨著CPU擴(kuò)展速度的減緩并最終大幅停止，我們應(yīng)該加速一切。

我預(yù)測(cè)，每個(gè)處理密集型的應(yīng)用程序都將加速，并且每個(gè)數(shù)據(jù)中心都將在不久的將來(lái)加速?，F(xiàn)在，加速計(jì)算是非常明智的一件事。如果你看一下應(yīng)用程序，這里的100t意味著100個(gè)時(shí)間單位，它可能是100秒，也可能是100個(gè)小時(shí)。我們現(xiàn)在正在開發(fā)可以運(yùn)行100天的人工智能應(yīng)用程序。1t是需要順序處理的代碼，其中單線程CPU非常重要。

操作系統(tǒng)控制邏輯對(duì)于一條指令接著另一條指令執(zhí)行非常重要。然而，計(jì)算機(jī)圖形是一種可以完全并行操作的圖形。計(jì)算機(jī)圖形學(xué)、圖像處理、物理模擬、組合優(yōu)化、圖形處理、數(shù)據(jù)庫(kù)處理，當(dāng)然還有非常著名的深度學(xué)習(xí)線性代數(shù)，有許多類型的算法非常有助于通過并行處理加速。

因此，我們發(fā)明了一種架構(gòu)來(lái)實(shí)現(xiàn)這一點(diǎn)，通過向CPU添加GPU，讓專用處理器花費(fèi)大量時(shí)間并將其加速到令人難以置信的速度。因?yàn)檫@兩個(gè)處理器可以并排工作，所以它們都是自主的，并且都是獨(dú)立的。也就是說，我們可以將過去需要100個(gè)單位時(shí)間的東西加速到一個(gè)單位時(shí)間。

嗯，速度提升聽起來(lái)難以置信，但今天我將為您展示許多例子。好處是非常非凡的，它速度提升100倍，但功率只增加了大約3倍，而你只增加了約50%的成本。我們?cè)趥€(gè)人電腦行業(yè)一直在這樣做，我們?cè)黾恿艘粋€(gè)GPU，一個(gè)500美元的GeForce GPU，到1000美元的電腦，性能大大提高。我們?cè)谝粋€(gè)十億美元的數(shù)據(jù)中心里這樣做，我們?cè)黾恿藘r(jià)值5億美元的GPU，突然間它變成了一個(gè)AI工廠。

這在當(dāng)今世界各地都在發(fā)生。嗯，節(jié)省的成本是非常非凡的，您每美元可以獲得60倍的性能，100倍的速度，加速，您只需要將功率增加3倍，100倍的速度，您只需要將成本增加1.5倍。節(jié)省的成本令人難以置信。很明顯，許多公司花費(fèi)數(shù)億美元在云端處理數(shù)據(jù)。如果它被加速，你可以節(jié)省數(shù)億美元，這并不出乎意料。

現(xiàn)在為什么呢？原因很清楚。

我們?cè)谕ㄓ糜?jì)算領(lǐng)域已經(jīng)經(jīng)歷了很長(zhǎng)時(shí)間的通貨膨脹。現(xiàn)在我們終于決心加速，這可以幫我們挽回巨大的損失。大量捕獲的廢數(shù)據(jù)現(xiàn)在可以將其從系統(tǒng)中釋放出來(lái)，這將轉(zhuǎn)化為儲(chǔ)蓄，儲(chǔ)蓄和金錢，儲(chǔ)蓄和能源。這就是為什么你聽我說你買的越多，你說的就越多。你買的越多，就越安全。加速計(jì)算確實(shí)提供了非凡的結(jié)果，但這并不容易。

沒有所謂的軟件可以通過交流編譯器運(yùn)行，然后突然之間該應(yīng)用程序的運(yùn)行速度提高了100倍。這甚至不符合邏輯。如果可以做到這一點(diǎn)，他們只需要更改CPU。要做到這一點(diǎn)，實(shí)際上你必須重寫軟件，以便您可以重構(gòu)在CPU上編寫的算法，以便它可以被加速、卸載、加速和并行運(yùn)行。計(jì)算機(jī)科學(xué)練習(xí)非常難，在過去的20年里，我們已經(jīng)讓它變得容易了。

當(dāng)然，非常著名的cuDNN，即處理神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)庫(kù)，我們有一個(gè)人工智能物理學(xué)庫(kù)，您可以將其用于流體動(dòng)力學(xué)和許多其他應(yīng)用，其中神經(jīng)網(wǎng)絡(luò)必須遵守物理定律。

我們有一個(gè)很棒的新項(xiàng)目，叫做Aerial，它是一個(gè)CUDA加速的5G無(wú)線電，這樣我們就可以用軟件定義和加速電信網(wǎng)絡(luò)，就像我們解決軟件定義世界網(wǎng)絡(luò)互聯(lián)網(wǎng)一樣。因此，我們加速的能力使我們能夠?qū)⑺须娦抛兂苫旧舷嗤愋偷钠脚_(tái)、計(jì)算平臺(tái)事業(yè)部，就像我們?cè)谠贫艘粯印?/p>

cuLitho是一個(gè)計(jì)算光刻平臺(tái)，使我們能夠處理芯片制造中計(jì)算密集型的部分，使得臺(tái)積電（TSMC）掩模使用cuLitho進(jìn)行生產(chǎn)，節(jié)省了大量的能源和資金。但是臺(tái)積電的目標(biāo)是加速他們的堆棧，以便他們?yōu)樗惴ǖ倪M(jìn)一步進(jìn)步和更深入的網(wǎng)絡(luò)和窄晶體管的更多計(jì)算做好準(zhǔn)備。

這是我們的基因測(cè)序庫(kù)。它是世界上最高通量的基因測(cè)序庫(kù)。cuOpt 是一個(gè)令人難以置信的庫(kù)，用于組合優(yōu)化、路線規(guī)劃優(yōu)化等問題?？茖W(xué)家們已經(jīng)得出結(jié)論，你需要一臺(tái)量子計(jì)算機(jī)來(lái)做這件事，我們創(chuàng)建了一個(gè)運(yùn)行在加速計(jì)算上的算法，它運(yùn)行得像閃電一樣快，創(chuàng)造了23項(xiàng)世界紀(jì)錄。我們今天保持著每一項(xiàng)主要的世界紀(jì)錄。

cuQuantum是量子計(jì)算機(jī)的仿真系統(tǒng)。如果你想設(shè)計(jì)一臺(tái)量子計(jì)算機(jī)，你需要一個(gè)模擬器來(lái)完成。如果你想設(shè)計(jì)量子算法，你需要一個(gè)量子模擬器來(lái)實(shí)現(xiàn)。如果量子計(jì)算機(jī)不存在，你將如何設(shè)計(jì)這些量子計(jì)算機(jī)，創(chuàng)建這些量子算法？你可以使用當(dāng)今世界上最快的計(jì)算機(jī)，我們稱之為NVIDIA CUDA，并且在其上我們有一個(gè)模擬量子計(jì)算機(jī)的模擬器，它被世界各地的數(shù)十萬(wàn)研究人員使用。它被集成到所有領(lǐng)先的量子計(jì)算框架中，并在世界各地的科學(xué)超級(jí)計(jì)算中心中使用，是一個(gè)令人難以置信的數(shù)據(jù)處理庫(kù)。

數(shù)據(jù)處理消耗了絕大多數(shù)的云指出，而僅靠CUDA是不可能的，世界各地的深度學(xué)習(xí)科學(xué)家都無(wú)法使用，CUDA、TensorFlow和PyTorch中使用的算法、深度學(xué)習(xí)算法分離得太遠(yuǎn)了。

這幾乎就像嘗試在沒有OpenGL的情況下進(jìn)行計(jì)算機(jī)圖形處理一樣，就像在沒有SQL的情況下進(jìn)行數(shù)據(jù)處理一樣。這些特定領(lǐng)域的庫(kù)真的是我們公司的財(cái)富。我們有350個(gè)庫(kù)，正是它們使我們能夠擁有如此開放的市場(chǎng)的原因。

今天我會(huì)給你看一些其他的例子。就在上周，谷歌宣布他們已經(jīng)將cuDF放入云端并加速Pandas。Pandas是世界上最受歡迎的數(shù)據(jù)科學(xué)庫(kù)。在座的許多人可能已經(jīng)在使用Pandas了。它被全球1000萬(wàn)數(shù)據(jù)科學(xué)家使用，每月被下載1.7億次。Excel是數(shù)據(jù)科學(xué)家的電子表格。只需單擊一下，您現(xiàn)在就可以在Colab中使用Pandas，這是谷歌的云數(shù)據(jù)中心平臺(tái)，由cuDF加速。速度真的令人難以置信。那是個(gè)很棒的演示，對(duì)吧？

當(dāng)您加快數(shù)據(jù)處理速度時(shí)，演示不需要很長(zhǎng)時(shí)間。CUDA現(xiàn)在已經(jīng)達(dá)到了人們所說的臨界點(diǎn)，但它甚至比這更好，CUDA現(xiàn)在已經(jīng)達(dá)到了一個(gè)良性循環(huán)。如果你回顧歷史和所有的計(jì)算架構(gòu)、計(jì)算平臺(tái)，這種情況很少發(fā)生。

在微處理器CPU的情況下，它已經(jīng)存在了60年。在這個(gè)水平上60年沒有改變。

加速計(jì)算已經(jīng)出現(xiàn)，創(chuàng)建一個(gè)新的平臺(tái)非常困難，因?yàn)檫@是一個(gè)先有雞還是先有蛋的問題。如果沒有開發(fā)人員使用您的平臺(tái)，那么當(dāng)然就沒有用戶，但是如果沒有用戶，就沒有安裝基礎(chǔ)。如果沒有基于安裝的開發(fā)人員對(duì)它不感興趣。開發(fā)人員希望為大型安裝基礎(chǔ)編寫軟件，但大型安裝基礎(chǔ)需要大量應(yīng)用程序，以便用戶可以創(chuàng)建該安裝基礎(chǔ)。

這個(gè)雞或蛋的問題很少被打破，現(xiàn)在已經(jīng)花了我們20年的時(shí)間。一個(gè)個(gè)的域庫(kù)，一個(gè)個(gè)加速庫(kù)，現(xiàn)在我們?cè)谌驌碛?00萬(wàn)開發(fā)人員。我們服務(wù)于每一個(gè)行業(yè)，包括醫(yī)療保健、金融服務(wù)、計(jì)算機(jī)行業(yè)、汽車行業(yè)，以及世界上幾乎每一個(gè)主要行業(yè)，幾乎每一個(gè)科學(xué)領(lǐng)域。因?yàn)槲覀兊慕ㄖ泻芏嗫蛻?。OEM和云服務(wù)提供商對(duì)構(gòu)建我們的系統(tǒng)感興趣。

系統(tǒng)制造商對(duì)構(gòu)建我們的系統(tǒng)感興趣，然后將更多的系統(tǒng)推向市場(chǎng)，這當(dāng)然為我們創(chuàng)造了更大的機(jī)會(huì)，這使我們能夠增加我們的研發(fā)規(guī)模，從而進(jìn)一步加快應(yīng)用程序的速度。嗯，每一次我們加速應(yīng)用程序，計(jì)算成本就會(huì)下降。

就像我在幻燈片里演示的一樣，100倍加速比轉(zhuǎn)化為97%、96%、98%，因此當(dāng)我們從100倍速度提高到200倍速度提高到1000倍速度時(shí)，計(jì)算的邊際成本節(jié)省將繼續(xù)下降。

當(dāng)然，我們相信通過令人難以置信地降低計(jì)算成本，市場(chǎng)開發(fā)者、科學(xué)家、發(fā)明家將繼續(xù)發(fā)現(xiàn)新的算法，這些算法消耗越來(lái)越多的計(jì)算資源，這樣總有一天會(huì)發(fā)生面部表情的變化。計(jì)算的邊際成本如此之低，以至于出現(xiàn)了一種新的使用計(jì)算機(jī)的方式。

事實(shí)上，這就是我們多年來(lái)所看到的，在過去10年中，我們已經(jīng)將一個(gè)特定算法的邊際計(jì)算成本降低了一百萬(wàn)倍。因此，現(xiàn)在使用互聯(lián)網(wǎng)上的所有數(shù)據(jù)來(lái)訓(xùn)練大型語(yǔ)言模型是其實(shí)是非常合乎邏輯的一件事。沒有人會(huì)三思而后行，認(rèn)為你可以創(chuàng)建一臺(tái)能夠處理如此多數(shù)據(jù)的計(jì)算機(jī)來(lái)編寫自己的軟件。

人工智能的出現(xiàn)之所以成為可能，是因?yàn)槲覀兺耆嘈牛绻覀冏層?jì)算變得越來(lái)越便宜，就會(huì)有人發(fā)現(xiàn)它有很大的用處。

好的，今天，CUDA已經(jīng)實(shí)現(xiàn)了良性循環(huán)，安裝基礎(chǔ)正在增長(zhǎng)，計(jì)算成本正在下降，這使得更多的開發(fā)人員提出更多的想法，從而推動(dòng)更多的需求。

現(xiàn)在我們正處于一件非常重要的事情的開始。但在我公布之前，我想先說下什么是不可能的，如果不是因?yàn)槲覀儎?chuàng)造了現(xiàn)代版本的通用AI，生成AI。那我們的新產(chǎn)品將不可能實(shí)現(xiàn)。

這個(gè)是地球2號(hào)，我們將創(chuàng)建地球的數(shù)字孿生體，我們將前往模擬地球，以便我們可以預(yù)測(cè)地球的未來(lái)，幫助我們更好地避免災(zāi)難或更好地了解氣候變化的影響，讓我們可以更好地適應(yīng)新環(huán)境，改變生活習(xí)慣。

這個(gè)地球的數(shù)字孿生體，可能是世界上有史以來(lái)最雄心勃勃的項(xiàng)目之一。我們每年都在向前邁出一大步。今年，我們?nèi)〉昧艘恍┲卮笸黄?，舉例來(lái)說。

周一，風(fēng)暴將再次向北并接近。它的路徑存在很大的不確定性，不同的路徑將對(duì)頂部產(chǎn)生不同程度的影響。想象一個(gè)我們能夠預(yù)測(cè)未來(lái)的世界——數(shù)字孿生，一個(gè)反映真實(shí)情況的虛擬世界，讓我們看見未來(lái)。數(shù)字孿生是一種反映真實(shí)世界的虛擬模型，讓我們能夠從今天的行為來(lái)預(yù)測(cè)對(duì)未來(lái)世界的影響。

介紹一下NVIDIA Earth-2，一個(gè)利用AI物理模擬和電腦圖形技術(shù)來(lái)預(yù)測(cè)全球氣候的數(shù)字孿生。FourCastNet是NVIDIA的生成式AI模型，它在WRF數(shù)值模擬的基礎(chǔ)上訓(xùn)練而成，能夠以12倍更高的分辨率生成天氣模式，從25公里提高到2公里，這代表了區(qū)域天氣預(yù)測(cè)的一個(gè)巨大飛躍。

令人驚訝的是，F(xiàn)ourCastNet比傳統(tǒng)的物理模擬方法快1000倍，且能源效率高3000倍。在氣象局，我們使用這些模型來(lái)更精確地預(yù)測(cè)臺(tái)風(fēng)登陸點(diǎn)。

但我們并不止步于此。

下一個(gè)前沿是超本地預(yù)測(cè)，能精確到數(shù)十米，并考慮到城市基礎(chǔ)設(shè)施的影響。FourCastNet AI還在使用像是PALM生成的高分辨率數(shù)據(jù)進(jìn)行訓(xùn)練。一個(gè)極高分辨率的物理模型用于模擬大氣和海洋邊界層。當(dāng)與天氣模擬風(fēng)場(chǎng)結(jié)合一起時(shí)，它可以模擬建筑物周圍的氣流。當(dāng)強(qiáng)風(fēng)匯聚的情況，我們預(yù)計(jì)能夠預(yù)測(cè)下沖這樣的現(xiàn)象。當(dāng)強(qiáng)風(fēng)匯聚到街道上，有可能造成損壞并影響行人。

NVIDIA Earth-2是一個(gè)絕佳范例，它融合了人工智能、物理模擬和觀測(cè)數(shù)據(jù)，可以幫助國(guó)家和公司預(yù)見未來(lái)并應(yīng)對(duì)極端天氣的影響。

不久的將來(lái)，我們可以隨時(shí)隨地提出我們的氣象預(yù)報(bào)。我們可以隨時(shí)掌握當(dāng)?shù)氐臍夂蜃兓?。而且它是連續(xù)性的預(yù)測(cè)，為什么呢？因?yàn)槲覀円呀?jīng)把這個(gè)AI都訓(xùn)練好了，而且它不需要消耗太多的電力。

希望大家喜歡剛才我們的這個(gè)例子，我的國(guó)語(yǔ)講得標(biāo)準(zhǔn)嗎？但這不是我說的，這個(gè)是Jason AI說的，我給他寫了這個(gè)臺(tái)詞，由Jason AI也就是我的數(shù)字孿生體幫我做旁白的，所以我的國(guó)語(yǔ)不夠好，但我有孿生幫我做的旁白，這真的是一個(gè)奇跡。

之前在2012年，我們正致力于推進(jìn)CUDA，致力于不斷提高驅(qū)動(dòng)器的性能并降低成本，此時(shí)研究人員發(fā)現(xiàn)了AI，這是英偉達(dá)與AI的第一次接觸。

這是一個(gè)非常重要的時(shí)間。我們與優(yōu)秀科學(xué)家合作，使深度學(xué)習(xí)發(fā)生成為可能。當(dāng)然，AlexNet實(shí)現(xiàn)了計(jì)算機(jī)視覺方面的巨大突破。但我們還需要了解背景是什么，深度學(xué)習(xí)的基礎(chǔ)是什么，它的長(zhǎng)期影響是什么，它的潛力是什么？

我們意識(shí)到這項(xiàng)技術(shù)具有巨大的潛力，可以擴(kuò)展幾十年前發(fā)明并發(fā)現(xiàn)的算法。突然之間，我們需要更多的數(shù)據(jù)，更大的網(wǎng)絡(luò)，非常重要的是，更多的計(jì)算。突然間，深度學(xué)習(xí)能夠?qū)崿F(xiàn)人類算法現(xiàn)在無(wú)法想象的目標(biāo)。如果我們進(jìn)一步擴(kuò)展架構(gòu)，使用更大的網(wǎng)絡(luò)，更多的數(shù)據(jù)和更多的計(jì)算，會(huì)發(fā)生什么呢？所以我們致力于重新發(fā)明一切。

在2012年之后，我們改變了GPU的架構(gòu)以添加Tensor Core，我們發(fā)明了10年前的NVLink，現(xiàn)在可以使用TensorRT。我們購(gòu)買了Mellanox，TensorRT，以嘗試推理服務(wù)器，所有這些都整合在一臺(tái)全新的計(jì)算機(jī)上。

沒有人理解，事實(shí)上，我確信沒有人想買它，所以我們?cè)贕TC上和OpenAI介紹它，它當(dāng)時(shí)還是舊金山的一家小公司，他們要求我給他們送一個(gè)。我在2016年向OpenAI交付了第一臺(tái)DGX，世界上第一臺(tái)AI超級(jí)計(jì)算機(jī)。

好的，在那之后，我們繼續(xù)從1臺(tái)AI超級(jí)計(jì)算機(jī)、1臺(tái)AI設(shè)備擴(kuò)展到大型超級(jí)計(jì)算機(jī)，到2017年甚至有了Transformer，這樣我們就可以訓(xùn)練大量數(shù)據(jù)并識(shí)別和學(xué)習(xí)在很長(zhǎng)一段時(shí)間內(nèi)順序排列的模式。現(xiàn)在我們可以訓(xùn)練這些大型語(yǔ)言模型來(lái)理解并實(shí)現(xiàn)自然語(yǔ)言理解突破，之后我們繼續(xù)努力，建造了更大的模型。

然后在2020年10月22日，在一臺(tái)非常大的AI超級(jí)計(jì)算機(jī)上訓(xùn)練了數(shù)千、數(shù)萬(wàn)個(gè)NVIDIA GPU。OpenAI五天后宣布ChatGPT達(dá)到100萬(wàn)用戶，五天后增加100萬(wàn)用戶，兩個(gè)月后增加1億用戶，這是歷史上增長(zhǎng)最快的應(yīng)用程序。

這背后的原因非常簡(jiǎn)單，它非常易于使用，使用起來(lái)非常神奇，能夠像人類一樣與計(jì)算機(jī)交互，而且清楚地知道你想要什么，就像計(jì)算機(jī)理解你的意思。

二、未來(lái)一切都與Token有關(guān)，而一切Token都由英偉達(dá)來(lái)生成

ChatGPT還沒有跟大家見面之前，所謂的人工智能都是需要如何理解自然語(yǔ)言、電腦視覺、語(yǔ)音的識(shí)別。換句話說是感知的能力，偵測(cè)的能力。

這是我們第一次看到有生成式的人工智能系統(tǒng)出現(xiàn)，它可以產(chǎn)生我們所謂的詞元（token），一次產(chǎn)生一個(gè)詞元，而這些詞元就變成是我們的文字。當(dāng)然有些詞元它可能是影像，它可能是線圖，可能是表格、歌曲、演講、視訊、影片，有可能是任何形式，只要是有意義的，都算是，甚至包括蛋白質(zhì)、化學(xué)分子等等。

你之前在NVIDIA Earth-2中看到的，我們正在生成天氣的詞元。我們可以理解，我們可以學(xué)習(xí)物理。如果你能學(xué)習(xí)物理，你可以教一個(gè)AI模型物理知識(shí)。AI模型可以學(xué)習(xí)物理學(xué)的含義，并且可以生成物理學(xué)。我們用的不是過濾的方法，我們用的是深層次的人工智能，讓我們的分辨率，氣候預(yù)報(bào)的分辨率不斷的提高。所以幾乎所有的事情都可以把它轉(zhuǎn)換成Token，Token是非常有價(jià)值的。

我們現(xiàn)在所處的不是AI時(shí)代，而是一個(gè)生成式AI時(shí)代。那它的重要性在哪里呢？原本我們說這是一部超級(jí)電腦，可是它現(xiàn)在不斷的進(jìn)化，它已經(jīng)變成了資料中心。而且它生產(chǎn)的東西是什么？就是資源。這就是一個(gè)人工智能工廠。他們產(chǎn)生的是新形態(tài)的大宗商品，每個(gè)產(chǎn)業(yè)都用得到，具有無(wú)比的價(jià)值。而他更好的是，他這種方法是可以復(fù)制的，是可以擴(kuò)展的。因此你們有沒有注意到，現(xiàn)在我們每一天都有一些新的生成式的AI模型被打造出來(lái)。

價(jià)值3萬(wàn)億美元的IT產(chǎn)業(yè)，即將創(chuàng)造一些可以直接服務(wù)于價(jià)值100萬(wàn)億美元的產(chǎn)業(yè)的東西，不再僅僅是信息存儲(chǔ)或數(shù)據(jù)處理的工具。而是一個(gè)為每個(gè)行業(yè)生成智能的工廠。AI 將帶來(lái)一個(gè)全新的制造業(yè)，不是計(jì)算機(jī)制造業(yè)，而是在制造業(yè)中使用計(jì)算機(jī)。

這是一場(chǎng)工業(yè)革命，而不僅僅是對(duì)我們行業(yè)的影響。我們可以為許多行業(yè)創(chuàng)造一種新的商品，一種我們稱之為“詞元”（token）的新產(chǎn)品。

正如我之前所說，60年來(lái)，不同的運(yùn)算方式都在改變。從CPU到通用目的的運(yùn)算，到加速的GPU運(yùn)算。以前電腦需要指令命令，現(xiàn)在它可以去處理大型語(yǔ)言模型、AI模型。

現(xiàn)在計(jì)算機(jī)處理大型語(yǔ)言模型、AI模型，而過去的計(jì)算模型是基于檢索的，幾乎每次你觸摸手機(jī)時(shí)，一些預(yù)先錄制的文本、預(yù)先錄制的圖像或預(yù)先錄制的視頻會(huì)為您檢索，并根據(jù)推薦系統(tǒng)重新合成，以根據(jù)您的習(xí)慣呈現(xiàn)給您。

但在未來(lái)，你的計(jì)算機(jī)將盡可能多地生成，只檢索必要的內(nèi)容。其原因是生成的數(shù)據(jù)需要較少的能量來(lái)獲取信息。生成的數(shù)據(jù)也更具上下文相關(guān)性。它將對(duì)知識(shí)進(jìn)行編碼，它將編碼你對(duì)你的理解，而不是為我獲取這些信息或?yàn)槲耀@取那個(gè)文件。

在未來(lái)，你只需要問電腦，它就能提供你需要的檔案和信息。未來(lái)的電腦不再只是我們所使用的工具了。未來(lái)電腦它甚至能夠生成新的技能，它會(huì)幫你做一些工作。所以未來(lái)這個(gè)產(chǎn)業(yè)它不再只是去設(shè)計(jì)軟件，設(shè)計(jì)應(yīng)用程序。

當(dāng)你使用ChatGPT時(shí)，在它們的堆棧下面是一堆軟件，在提示符下面是軟件，這是非常復(fù)雜的，因?yàn)槟Ｐ陀袛?shù)十億到萬(wàn)億個(gè)參數(shù)。它不是只在一臺(tái)計(jì)算機(jī)上運(yùn)行，而是在多臺(tái)計(jì)算機(jī)上運(yùn)行。它必須將工作負(fù)載分布在多個(gè)GPU上，張量并行，管道并行數(shù)據(jù)，各種并行，專家并行，各種并行，將工作負(fù)載分布在多個(gè)GPU上，盡可能快地處理它。

當(dāng)然，這在90年代是非常了不起的。大家別忘記當(dāng)時(shí)微軟他們有這個(gè)套裝軟件，可以說是改變了整個(gè)電腦的產(chǎn)業(yè)。

因?yàn)槿绻麤]有這些套裝軟件的話，我們干嘛要電腦呢？我們電腦能拿來(lái)做什么呢？

所以這些套裝軟件當(dāng)然推動(dòng)了整個(gè)產(chǎn)業(yè)。但是現(xiàn)在我們有新的工廠，新的電腦，我們現(xiàn)在也會(huì)有新的軟件，我們就把它叫做NIM，NVIDIA的推理即服務(wù)。這個(gè)NIM它是在工廠里頭運(yùn)行的，而這個(gè)NIM它是一個(gè)預(yù)先訓(xùn)練的模型，它是一個(gè)AI。這個(gè)AI當(dāng)然本身是非常的復(fù)雜，但是去運(yùn)行這個(gè)AI的運(yùn)算堆疊，它非常的復(fù)雜。

你去使用ChatGPT, 它底下有非常非常多軟件。你下一個(gè)指令，你下一個(gè)提示，背后其實(shí)有非常多的軟件正在跑。所以它不只是在一個(gè)參數(shù)上面跑，是數(shù)以萬(wàn)計(jì)、數(shù)以億計(jì)的這個(gè)運(yùn)算參數(shù)在跑。它需要做Tensor的各式各樣的并行、不同的平行等等平行運(yùn)算。所以它有各式各樣的平行在走，它在不同的GPU上分配它的這個(gè)作業(yè)負(fù)載，它的速度也非常的快。

如果我們今天要經(jīng)營(yíng)工廠的話，你的這個(gè)產(chǎn)量是多少？跟你的服務(wù)品質(zhì)，跟你的營(yíng)收，跟有多少人可以使用你的服務(wù)有非常正向的關(guān)系。

我們現(xiàn)在的這個(gè)資料中心，它的傳輸量非常的大，所以傳輸量的使用率就很重要了。以前也很重要，只是沒那么重要。以前很重要，但是大家不會(huì)去測(cè)量它?，F(xiàn)在每一個(gè)參數(shù)都必須要測(cè)量起始時(shí)間、使用時(shí)間、利用率、idle的時(shí)間等等。因?yàn)楝F(xiàn)在它就變成是一座工廠了。它一旦它變成工廠，它的一切的運(yùn)行就會(huì)跟這家公司它的財(cái)務(wù)表現(xiàn)有很密切的關(guān)系。我們知道對(duì)于大部分的公司來(lái)說，這都是非常復(fù)雜的事情。

三、你在AI時(shí)代需要的，英偉達(dá)全都有

所以我們就去把這個(gè)AI裝進(jìn)了一個(gè)盒子里頭，這些容器，這些container里頭有非常多很棒的軟件。

在這個(gè)容器里頭有CUDA、cuDNN、TensorRT Triton，它是推理即服務(wù)，它是在云端上的一個(gè)堆疊。

除此之外它也有各式各樣的管理的服務(wù)，還有hooks可以去讓大家監(jiān)督自己的AI，它有通用的API、標(biāo)準(zhǔn)的API，所以基本上你就可以跟這個(gè)盒子來(lái)對(duì)話，你把這個(gè)推理即服務(wù)下載，你可以跟他對(duì)話。所以你在只要你的電腦上有CUDA，基本上現(xiàn)在基本上每一組每每一朵云上面都有，有數(shù)億臺(tái)電腦上面都有。大家把它下載之后，你就有AI你可以跟他對(duì)話，就像你跟ChatGPT對(duì)話一樣。所有的軟件現(xiàn)在都整合在一起了，四百多個(gè)dependency都把它整合在一起。

我們測(cè)試了這些NIM，每一個(gè)都是預(yù)先訓(xùn)練的，是他們都是可以安裝的。在各種云上面，不管是Pascal或者是Ampere，各種不同的版本，Hopper也可以各式各樣不同的版本。我甚至還會(huì)忘記有哪一些。所以NIM這個(gè)NVIDIA的推理即服務(wù)，真的是很棒的一個(gè)發(fā)明，我真的非常的喜歡。我想大家也知道，我們現(xiàn)在可以創(chuàng)造各式各樣的大型語(yǔ)言模型，還有預(yù)先訓(xùn)練的模型。我們有各式各樣不同的版本，不管它是語(yǔ)言版本的，或者視覺，或者是圖片版本為主的，或者是說針對(duì)這個(gè)醫(yī)療保健產(chǎn)業(yè)的、數(shù)字生物產(chǎn)業(yè)的。

我們還有是所謂的數(shù)字人。甚至我們可以請(qǐng)大家去看一下，我們今天才貼了Hugging Face這個(gè)Llama 2 NIM，它是完全優(yōu)化的，大家可以去試試看，甚至可以帶著走，那是免費(fèi)的。所以大家可以在云上面來(lái)運(yùn)行，然后可以下載這個(gè)容器放在自己的資料中心里頭，你可以放在自己的資料中心提供給你的客戶使用。

使用它的方式是將這些微服務(wù)連接到大型應(yīng)用程序中。當(dāng)然，未來(lái)最重要的應(yīng)用之一是客戶服務(wù)代理。幾乎每個(gè)行業(yè)都需要客戶服務(wù)代理。它代表著全球數(shù)萬(wàn)億美元的客戶服務(wù)。護(hù)士在某些方面是客戶服務(wù)代理，其中一些是非處方或非診斷性質(zhì)的。

現(xiàn)在可以通過語(yǔ)言模型和AI增強(qiáng)數(shù)千萬(wàn)的客戶服務(wù)，所以你看到的基本上是NIM，其中一些NIM是給定任務(wù)的推理代理，找出任務(wù)是什么，將其分解成一個(gè)計(jì)劃。一些NIM檢索信息，一些NIM可能會(huì)去搜索，可能一些NIM會(huì)使用我之前提到的cuDF工具，他們可以使用一種可以在SAP上運(yùn)行的工具，因此它必須學(xué)習(xí)一種名為ABAP的特定語(yǔ)言。也許一些NIM必須進(jìn)行SQL查詢。

因此，所有這些NIM都是現(xiàn)在組成一個(gè)團(tuán)隊(duì)的專家。應(yīng)用層已經(jīng)發(fā)生了變化，曾經(jīng)用指令編寫的應(yīng)用程序現(xiàn)在變成了組裝團(tuán)隊(duì)的應(yīng)用程序，很少有人知道如何編寫程序。幾乎每個(gè)人都知道如何分解問題并組建團(tuán)隊(duì)。

我相信未來(lái)的每家公司都將擁有大量的NIM團(tuán)隊(duì)，你可以帶下你想要的專家，將他們連接成一個(gè)團(tuán)隊(duì)，你甚至不需要弄清楚如何連接他們，你只需將任務(wù)交給代理人。給一個(gè)名字，以找出誰(shuí)來(lái)分解任務(wù)以及將任務(wù)交給誰(shuí)。然后，應(yīng)用程序的領(lǐng)導(dǎo)者，如果你愿意，團(tuán)隊(duì)的領(lǐng)導(dǎo)者會(huì)分解任務(wù)并將其交給各個(gè)團(tuán)隊(duì)成員，團(tuán)隊(duì)成員將執(zhí)行他們的任務(wù)，并將其帶回團(tuán)隊(duì)領(lǐng)導(dǎo)者。

團(tuán)隊(duì)領(lǐng)導(dǎo)會(huì)對(duì)此進(jìn)行推理，并向您反饋信息，就像人類一樣。在不久的將來(lái)，這就是應(yīng)用程序的外觀?，F(xiàn)在我們可以通過文本提示和語(yǔ)音提示與這些大型AI服務(wù)進(jìn)行交互，但是，在許多應(yīng)用程序中，我們希望與其他類似人類的形式進(jìn)行交互。我們稱它們?yōu)閿?shù)字人類。英偉達(dá)研究數(shù)字人類技術(shù)已經(jīng)有一段時(shí)間了。

數(shù)字人類有潛力成為一個(gè)偉大的互動(dòng)代理，與你互動(dòng)，他們可以讓你更有吸引力，更有同理心。當(dāng)然，我們必須跨越這個(gè)令人難以置信的鴻溝，這個(gè)不可思議的現(xiàn)實(shí)主義鴻溝，這樣數(shù)字人類就會(huì)顯得更加自然。這當(dāng)然是我們的愿景，這是我們喜歡去的地方的愿景，但讓我向您展示我們現(xiàn)在的位置。

想象一下，未來(lái)的計(jì)算機(jī)可以像人類一樣與我們互動(dòng)。這就是數(shù)字人類令人難以置信的潛力。數(shù)字人類將徹底改變從客戶服務(wù)到廣告和游戲的各個(gè)行業(yè)。

利用手機(jī)掃描廚房，AI室內(nèi)設(shè)計(jì)師就能生成照片級(jí)逼真的設(shè)計(jì)建議，并采購(gòu)材料和家具。我們已經(jīng)為您生成了幾種設(shè)計(jì)方案。數(shù)字人類還可以成為AI客戶服務(wù)代理，提供更具吸引力的互動(dòng)體驗(yàn)，或化身數(shù)字醫(yī)療保健工作者，提供及時(shí)、個(gè)性化的護(hù)理。他們甚至可以成為AI品牌大使，引領(lǐng)營(yíng)銷和廣告的新潮流。

生成式人工智能和計(jì)算機(jī)圖形學(xué)的新突破，讓數(shù)字人類能夠以人類的方式看、聽、理解和與我們互動(dòng)。從我看到的，您似乎正在進(jìn)行某種錄音或制作。數(shù)字人類的基礎(chǔ)是基于多語(yǔ)言語(yǔ)音識(shí)別和合成的人工智能模型，以及能夠理解和生成對(duì)話的人工智能模型。

AI連接到另一個(gè)生成式AI，動(dòng)態(tài)制作逼真的3D面部網(wǎng)格動(dòng)畫。最后，能夠重現(xiàn)逼真外觀的人工智能模型實(shí)現(xiàn)了實(shí)時(shí)路徑追蹤和次表面散射，模擬光線穿透皮膚、散射并在不同點(diǎn)離開的方式，使皮膚呈現(xiàn)出柔軟和半透明的外觀。

NVIDIA Ace是一套數(shù)字人類技術(shù)，打包成易于部署、完全優(yōu)化的微服務(wù)或“Nim”。開發(fā)人員可以將Ace Nim集成到他們現(xiàn)有的框架、引擎和數(shù)字人類體驗(yàn)中。NIM Tron SLM和LM Nim可以理解我們的意圖并協(xié)調(diào)其他模型。Riva語(yǔ)音Nim用于交互式語(yǔ)音和翻譯；音頻到面部和身體動(dòng)畫的面部和手勢(shì)Nim；以及Omniverse RTX與DLSS用于皮膚和頭發(fā)的神經(jīng)渲染。Nim運(yùn)行在NVIDIA GDM之上，這是一個(gè)全球性的NVIDIA加速基礎(chǔ)設(shè)施網(wǎng)絡(luò)，為100多個(gè)地區(qū)提供低延遲的數(shù)字人類處理。

我們一直在研發(fā)AI GPU，為這一天做好準(zhǔn)備。原因很簡(jiǎn)單，我們一直都知道，要?jiǎng)?chuàng)建一個(gè)新的計(jì)算平臺(tái)事業(yè)部，首先需要一個(gè)已安裝的基礎(chǔ)。最終，應(yīng)用程序會(huì)隨之而來(lái)。如果你不創(chuàng)建已安裝的基礎(chǔ)，應(yīng)用程序從何而來(lái)？因此，如果你建造它，它們可能會(huì)來(lái)，但如果你不建造它，它們就一定不會(huì)來(lái)。因此，我們安裝了每個(gè)帶有張量核心處理的RTX GPU?，F(xiàn)在，我們?cè)谌驌碛?億個(gè)GeForce RTX AIPC。

在這次發(fā)布會(huì)上，我們展示了4款令人驚嘆的新筆記本電腦。它們都能夠運(yùn)行AI。你未來(lái)的筆記本電腦，你未來(lái)的電腦都將融入AI。它會(huì)不斷地幫助你，在后臺(tái)協(xié)助你。PC還將運(yùn)行由AI增強(qiáng)的應(yīng)用程序。當(dāng)然，你所有的照片編輯、寫作和工具，以及你使用的所有東西都將通過AI得到增強(qiáng)。你的電腦也將托管帶有數(shù)字人類的應(yīng)用程序。

AI將以不同的方式在個(gè)人電腦上呈現(xiàn)和使用，但個(gè)人電腦將成為一個(gè)非常重要的AI平臺(tái)。那么我們從這里走向哪里呢？我之前談到了我們數(shù)據(jù)中心的擴(kuò)展。每一次擴(kuò)展，當(dāng)我們從DGX擴(kuò)展到大型AI超級(jí)計(jì)算機(jī)時(shí)，我們發(fā)現(xiàn)了一個(gè)新的拐點(diǎn)，我們讓Transformer能夠在非常大的數(shù)據(jù)集上進(jìn)行訓(xùn)練。

嗯，一開始發(fā)生的事情是，數(shù)據(jù)是由人類監(jiān)督的。需要人工標(biāo)記來(lái)訓(xùn)練人工智能系統(tǒng)。不幸的是，人類標(biāo)簽的數(shù)量是有限的。Transformers使無(wú)監(jiān)督學(xué)習(xí)成為可能。現(xiàn)在，Transformers只需查看大量數(shù)據(jù)或查看大量視頻，或查看更大量的圖像，它們可以從研究大量數(shù)據(jù)中學(xué)習(xí)，找到模式和關(guān)系本身。

雖然下一代AI需要基于物理，但今天大多數(shù)AI都不理解物理定律。它不是植根于物理世界，無(wú)法生成圖像、視頻、3D圖形和許多物理現(xiàn)象。我們需要基于物理并理解物理定律的AI。當(dāng)然，從視頻中學(xué)習(xí)是一個(gè)來(lái)源。另一種方式是合成數(shù)據(jù)、模擬數(shù)據(jù)，另一種方式是使用計(jì)算機(jī)相互學(xué)習(xí)。這與使用AlphaGo沒有什么不同，讓AlphaGo自己玩自己的游戲，在這兩種能力之間，將相同的能力相互玩很長(zhǎng)一段時(shí)間，它們變得更加聰明。

你開始看到這種類型的AI崛起，如果任何數(shù)據(jù)都是合成生成并使用強(qiáng)化學(xué)習(xí)，那么數(shù)據(jù)生成速度將繼續(xù)提高是合理的。每一次數(shù)據(jù)生成的增長(zhǎng)，我們所提供的計(jì)算量也需要隨之增長(zhǎng)。我們即將進(jìn)入一個(gè)階段，在這里，AI可以學(xué)習(xí)物理和理解定律，并以物理世界的數(shù)據(jù)為基礎(chǔ)，因此我們預(yù)計(jì)模型將繼續(xù)增長(zhǎng)，我們需要更大的GPU。Blackwell就是為這一代人設(shè)計(jì)的。

這是Blackwell，擁有幾項(xiàng)非常重要的技術(shù)。當(dāng)然，這只是芯片的大小。我們拿了兩個(gè)最大的芯片，一個(gè)是TSMC所能做到的最大的芯片，我們將其中兩個(gè)連接在一起，每個(gè)第二個(gè)環(huán)節(jié)10TB，將世界上最先進(jìn)的GPU連接在一起。將這兩個(gè)連接在一起，然后我們將其中兩個(gè)放在一個(gè)計(jì)算機(jī)節(jié)點(diǎn)上，用一個(gè)Grace CPU連接它。

在訓(xùn)練情況下，Grace CPU可以用于幾件事情。它可以使用，它可以用于快速檢查點(diǎn)和在推理和生成的情況下重新啟動(dòng)。它可以用于存儲(chǔ)上下文記憶，以便AI具有記憶并理解我們想要的對(duì)話的上下文。這是我們的第二代Transformer引擎。Transformer引擎允許我們根據(jù)該計(jì)算層所需的精度和范圍動(dòng)態(tài)適應(yīng)較低的精度。這是我們的第二代GPU，具有安全的AI，因此您可以要求服務(wù)提供商保護(hù)您的AI免遭竊取、盜竊或篡改。這是我們的第五代NVLink。

NVLink允許我們將多個(gè)GPU連接在一起。這也是我們第一代具有可靠性和可用性引擎的產(chǎn)品。這個(gè)RAS系統(tǒng)，允許我們測(cè)試每一個(gè)晶體管片上存儲(chǔ)器觸發(fā)器、片外存儲(chǔ)器，這樣我們就可以在現(xiàn)場(chǎng)確定某個(gè)芯片是否沒有MTBF。與此同時(shí)，一臺(tái)擁有10000個(gè)GPU的超級(jí)計(jì)算機(jī)發(fā)生故障之間的間隔是以小時(shí)為單位測(cè)量的。超級(jí)計(jì)算機(jī)故障之間的時(shí)間間隔是100000個(gè)GPU的間隔。它以分鐘為單位測(cè)量。

如果我們不發(fā)明技術(shù)來(lái)增強(qiáng)其可靠性，超級(jí)計(jì)算機(jī)能夠長(zhǎng)期運(yùn)行并訓(xùn)練可能持續(xù)數(shù)月的模型的能力實(shí)際上是不可能的?？煽啃援?dāng)然會(huì)增加正常運(yùn)行時(shí)間，這直接影響成本。最后，減壓。引擎數(shù)據(jù)處理是我們必須做的最重要的事情之一。我們添加了數(shù)據(jù)壓縮引擎解壓縮引擎，以便我們可以以比今天更快的速度20倍的速度從存儲(chǔ)中提取數(shù)據(jù)。

所有這些都代表了Blackwell。我們?cè)贕TC期間展示了Blackwell的原型。這是世界上有史以來(lái)最復(fù)雜、最高性能的計(jì)算機(jī)。這是灰色的CPU。這些是Blackwell模具，其中兩個(gè)連接在一起。

這是世界上最大的芯片。我們用10TB/s的NVLink將兩個(gè)GPU連接在一起。這使得Blackwell計(jì)算機(jī)的性能令人難以置信。我們?cè)诎四陜?nèi)將計(jì)算量和人工智能模型規(guī)模提高了一千倍。我們通過計(jì)算能力的提升降低了能耗。用于訓(xùn)練GPT-4的2萬(wàn)億參數(shù)、8萬(wàn)億token，能耗下降了350倍。以前用Pascal架構(gòu)需要1000吉瓦時(shí)，這意味著需要一個(gè)千兆瓦的數(shù)據(jù)中心。世界上沒有千兆瓦的數(shù)據(jù)中心，即使有，訓(xùn)練也需要一個(gè)月的時(shí)間。

這就是為什么僅在八年前，我們通過不斷提高性能和能效來(lái)實(shí)現(xiàn)ChatGPT這樣的大型語(yǔ)言模型。如果一臺(tái)超級(jí)計(jì)算機(jī)有1萬(wàn)個(gè)GPU，平均無(wú)故障時(shí)間是1萬(wàn)小時(shí)。但現(xiàn)在是用分鐘來(lái)衡量的，所以一臺(tái)超級(jí)計(jì)算機(jī)要能夠運(yùn)行很長(zhǎng)一段時(shí)間，才能長(zhǎng)期訓(xùn)練一個(gè)模型。這就要求我們的技術(shù)非?？煽浚荒苤袛噙\(yùn)行。持續(xù)運(yùn)行需要花費(fèi)很多時(shí)間和金錢。所以我們加入了數(shù)據(jù)壓縮和解壓縮引擎，讓數(shù)據(jù)訪問速度提高20倍。

四、展示Blackwell，劇透它的替代者

這就是Blackwell，我們這里有一個(gè)已經(jīng)在生產(chǎn)中的Blackwell。在GTC，我給大家看了Blackwell的原型。這就是我們正式生產(chǎn)的Blackwell，里面有最尖端的技術(shù)。這是我們實(shí)際生產(chǎn)的版本，可以說是功能和性能最強(qiáng)大的芯片。這是我們的CPU。每個(gè)裸晶包含兩個(gè)GPU，這可以說是世界上我們可以生產(chǎn)出來(lái)的最大的芯片。它兩個(gè)串聯(lián)起來(lái)的時(shí)候，連接的速度是10TB/s。Blackwell電腦的性能非常強(qiáng)大。

這是一個(gè)DGX Blackwell，氣冷式，里面有八個(gè)這樣的GPU?？纯催@些GPU上的散熱片大小。大約15千瓦，完全氣冷式。這個(gè)版本支持x86，并且進(jìn)入了我們一直在運(yùn)輸?shù)腍opper基礎(chǔ)設(shè)施。但是，如果您想要液體冷卻，我們有一個(gè)新系統(tǒng)。這個(gè)新系統(tǒng)基于模塊化的MGX。這是兩個(gè)Blackwell板。所以這個(gè)節(jié)點(diǎn)有四個(gè)Blackwell芯片，這是一個(gè)兩層的系統(tǒng)。九個(gè)這樣的節(jié)點(diǎn)加在一起，總共有72個(gè)GPU，用新的NVLink連接在一起。這是我們的NVLink交換器，是我們第五代NVLink產(chǎn)品。

NVLink交換器可以說是科技上的一種奇跡，它的數(shù)據(jù)傳輸速率真的太快了。

如果把所有Blackwell芯片串聯(lián)在一起，就可以有一個(gè)72個(gè)GPU的Blackwell系統(tǒng)。這樣做的好處是，在每個(gè)GPU的領(lǐng)域中，看起來(lái)就像一個(gè)GPU，但實(shí)際上有72個(gè)。與上一代相比，數(shù)量是9倍，帶寬是18倍，浮點(diǎn)運(yùn)算能力是45倍，但功耗只有10倍。這是一個(gè)100千瓦的系統(tǒng)，之前是10千瓦。當(dāng)然你可以把更多的芯片串聯(lián)在一起。

為什么說NVLink芯片是一個(gè)科技上的奇跡呢？

因?yàn)镹VLink把所有芯片串聯(lián)在一起，大型語(yǔ)言模型不能只有一個(gè)節(jié)點(diǎn)，不能只有一個(gè)GPU。我們必須把整個(gè)機(jī)架里頭所有的GPU全部都連接在一起，這樣才能有一個(gè)可以處理十兆參數(shù)以上的大型語(yǔ)言模型。它有500億個(gè)晶體管，72個(gè)端口，4個(gè)NVLink，每秒速度是1.8TB。

這就是我們現(xiàn)在的DGX。很多人都在問我們，NVIDIA到底是做什么的，為什么單憑GPU就能變得這么大？這就是GPU，這可以說是世界上最先進(jìn)的GPU，不過這是打電話用的GPU。我旁邊的這個(gè)也是一個(gè)GPU，各位女士，各位先生，這就是我們的DGX，GPU跟過去已經(jīng)截然不同了。

這個(gè)GPU的后面就是NVLink所組成的一個(gè)背板。這個(gè)背板當(dāng)中有5000條線，加起來(lái)有兩英里這么長(zhǎng)。這就是我們所謂的NVLink背板，可以連接72個(gè)GPU。把70個(gè)GPU連接在一起，這可以說是在電機(jī)學(xué)上面的一種奇跡。它通過銅線讓NVLink交換器，透過背板當(dāng)中的銅線，讓我們一個(gè)機(jī)架可以節(jié)省20千瓦。我們可以把節(jié)省下來(lái)的20千瓦用來(lái)進(jìn)行數(shù)據(jù)處理，這就是NVLink背板。

我們要打造AI工廠，所以我們必須要有更高速的網(wǎng)絡(luò)技術(shù)。我們有兩種InfiniBand。第一種InfiniBand用在AI工廠和超級(jí)電腦當(dāng)中，而且它成長(zhǎng)的速度非常的快?？墒遣⒉皇敲總€(gè)資料中心都可以用InfiniBand，因?yàn)樗麄円郧耙呀?jīng)采用了以太網(wǎng)絡(luò)了。實(shí)際上，管理InfiniBand是需要一些特別的技術(shù)。因此我們就把InfiniBand的一些功能，放到以太網(wǎng)絡(luò)的架構(gòu)當(dāng)中。這其實(shí)非常的困難，為什么呢？

道理很簡(jiǎn)單。以太網(wǎng)絡(luò)當(dāng)初設(shè)計(jì)的時(shí)候，它是針對(duì)平均傳輸量比較高的系統(tǒng)。每個(gè)電腦、每個(gè)節(jié)點(diǎn)都是連接到一個(gè)不同的人，大部分是資料中心跟另外一端的人在進(jìn)行溝通?？墒茿I工廠當(dāng)中的深度學(xué)習(xí)系統(tǒng)GPU并不是跟人來(lái)做溝通。GPU是他們彼此之間在做溝通，因?yàn)樗麄冊(cè)谑占瘮?shù)據(jù)，也就是把產(chǎn)品的部分?jǐn)?shù)據(jù)收集起來(lái)，然后進(jìn)行縮減，然后再重新的來(lái)進(jìn)行分配。所以重點(diǎn)不是平均的傳輸量，而是最后一個(gè)接收到信息的那個(gè)GPU。

因?yàn)槟闶菑拿總€(gè)人那邊去收集一些資料，看誰(shuí)的速度最慢。這個(gè)系統(tǒng)的速度就決定于哪一個(gè)人給資料的時(shí)候速度最慢。那個(gè)人就決定了這樣的一個(gè)速度。過去以太網(wǎng)絡(luò)是辦不到的，所以我們必須要有端到端的架構(gòu)。這當(dāng)中有四個(gè)不同的技術(shù)。NVIDIA有世界上最先進(jìn)的NVLink和RDMA。

RDMA是專門針對(duì)以太網(wǎng)絡(luò)所做的設(shè)計(jì)。除此之外，我們還有擁塞控制系統(tǒng)，它很快的在處理這些參數(shù)的數(shù)值。每次假如有任何GPU送出太多的資料，我們就叫他們慢一點(diǎn)，這樣才不會(huì)產(chǎn)生瓶頸。第三個(gè)就是自適應(yīng)路由，以太網(wǎng)絡(luò)必須要傳送和接收資料的時(shí)候，必須要按順序來(lái)。假如我們看到有任何端口沒有使用，或者是有塞車的情形，我們就把這個(gè)信息送到?jīng)]有使用的端口，這樣我們就可以把工作的順序重新安排好。

還有一個(gè)很重要，就是流量隔離。因?yàn)槲覀冊(cè)谟?xùn)練的模組不止一個(gè)，所以資料中心里頭一定都會(huì)有一些其他流量。一旦進(jìn)入我們的工作流程當(dāng)中，就會(huì)產(chǎn)生噪音。這樣就會(huì)影響數(shù)據(jù)傳遞的速度，就會(huì)使訓(xùn)練的速度變慢。我們已經(jīng)打造了一個(gè)50億或者30億美金造價(jià)的資料中心來(lái)做訓(xùn)練。假如網(wǎng)絡(luò)的利用率降低40%，培訓(xùn)時(shí)間延長(zhǎng)了20%，那么50億美元的數(shù)據(jù)中心實(shí)際上花費(fèi)了60億美元。因此成本影響相當(dāng)大。

使用Spectrum-X以太網(wǎng)基本上允許我們大大提高性能，因此網(wǎng)絡(luò)基本上是免費(fèi)的。所以這真的是一個(gè)相當(dāng)大的成就。我們非常，我們擁有完整的以太網(wǎng)產(chǎn)品管道。這是Spectrum-X 800，它是51.2 Tb每秒和256個(gè)端口。

接下來(lái)即將到來(lái)的是512端口的Spectrum-X，即一年之后的Spectrum-X 800 Ultra。之后的那個(gè)是X 1600。重要的是，X 800是為成千上萬(wàn)個(gè)GPU設(shè)計(jì)的，X 800 Ultra也是為成千上萬(wàn)個(gè)GPU設(shè)計(jì)的，而X 1600是為數(shù)百萬(wàn)個(gè)GPU而設(shè)計(jì)的。數(shù)百萬(wàn)GPU數(shù)據(jù)中心的日子即將到來(lái)。

原因很簡(jiǎn)單。當(dāng)我們希望訓(xùn)練更大的模型時(shí)，在未來(lái)，幾乎你與互聯(lián)網(wǎng)或計(jì)算機(jī)的每次互動(dòng)都可能在云端運(yùn)行生成式AI。生成式AI正在與你合作，與你互動(dòng)，生成視頻、圖像或文本，或者可能是數(shù)字人。因此，你幾乎一直在與計(jì)算機(jī)進(jìn)行交互，并且總是有一個(gè)生成式AI與之相連。有些在本地，有些在你的設(shè)備上，其中很多可能在云端。

這些生成式AI還將具有大量的推理能力，而不僅僅是一次性答案，它們可能會(huì)對(duì)答案進(jìn)行迭代，以便在將答案提供給您之前提高答案的質(zhì)量。因此，未來(lái)我們將要處理的生成內(nèi)容的數(shù)量將是非凡的。

讓我們現(xiàn)在來(lái)看看今晚所有這些，這是我們的第一個(gè)夜間主題演講。你不能在早上的主題演講中這樣做。我認(rèn)為這種基調(diào)風(fēng)格在Computex中從未做過，可能是最后一次。只有媒體才能做到這一點(diǎn)，只有我能做到。當(dāng)然，Blackwell是最初推出的第一代媒體平臺(tái)。

正如世界所知，生成式AI時(shí)代已經(jīng)到來(lái)。正如世界意識(shí)到AI工廠的重要性一樣，正如這場(chǎng)新工業(yè)革命的開始。我們有如此多的支持者，幾乎每個(gè)OEM、每個(gè)計(jì)算機(jī)制造商、每個(gè)CSP、每個(gè)GPU云、主權(quán)云，甚至電信公司，世界各地的企業(yè)，成功的數(shù)量，采用率，對(duì)Blackwell的熱情程度都非常令人興奮。我想為此感謝大家。

我們不會(huì)止步于此。在這個(gè)令人難以置信的增長(zhǎng)時(shí)期，我們希望確保繼續(xù)提高性能，繼續(xù)降低成本，包括培訓(xùn)成本、推理成本，并繼續(xù)擴(kuò)展AI能力，以使每家公司都能接受。我們走的越遠(yuǎn)，性能越強(qiáng)，成本下降就越大。當(dāng)然，Hopper平臺(tái)可能是歷史上最成功的數(shù)據(jù)中心處理器。這只是一個(gè)令人難以置信的成功故事。

然而，Blackwell就在這里，正如你所注意到的，每個(gè)平臺(tái)都有幾件事情。你有CPU，有GPU，有NVLink，有NIC，還有這個(gè)交換器。NVLink交換器會(huì)把所有的GPU連接在一起，把它變成一個(gè)最大的領(lǐng)域。我們因此可以用非常高速的交換器。但其實(shí)它是一整個(gè)平臺(tái)，我們打造一整個(gè)平臺(tái)，我們把整平臺(tái)整合成一個(gè)AI工廠的超級(jí)電腦，我們?cè)侔阉稚?，讓全世界都可以使用?/p>

在座各位都有能力去創(chuàng)造非常有趣、非常有創(chuàng)意的一個(gè)設(shè)置配置，可以用不同的風(fēng)格，不同的數(shù)據(jù)中心，不同的顧客。你們可以在不同的地方，不同的邊緣，甚至是有一些是電商等等。所以我們盡量讓它有彈性，讓大家可以有最有創(chuàng)意的方式來(lái)進(jìn)行建構(gòu)。

關(guān)于Blackwell平臺(tái)，我們公司按照一年一個(gè)的節(jié)奏推出。我們的基本理念非常簡(jiǎn)單，我們要建立整個(gè)數(shù)據(jù)中心，再將它分解，并以一年的節(jié)奏部分賣給用戶。我們將一切推向技術(shù)極限。無(wú)論是什么TSMC工藝，技術(shù)都會(huì)把它推向絕對(duì)極限，無(wú)論是什么封裝技術(shù)，都將它推向絕對(duì)極限，無(wú)論是什么存儲(chǔ)技術(shù)，都將它推向絕對(duì)極限，無(wú)論是網(wǎng)絡(luò)技術(shù)，光學(xué)技術(shù)，一切都將被推向極限。

然后在那之后，以這樣的方式做所有事情，以便我們所有的軟件都能在整個(gè)安裝的基礎(chǔ)上運(yùn)行。軟件慣性是計(jì)算機(jī)中最重要的事情。當(dāng)計(jì)算機(jī)向后兼容并且在架構(gòu)上與已經(jīng)創(chuàng)建的所有軟件兼容時(shí)，您進(jìn)入市場(chǎng)的能力將更快。因此，當(dāng)我們可以利用整個(gè)軟件安裝基礎(chǔ)時(shí)，速度是令人難以置信的。這就是我們?cè)贐lackwell在場(chǎng)時(shí)所創(chuàng)造的一切。

明年我們將推出Blackwell Ultra，就像我們有H-100和H-200一樣，你可能會(huì)看到我們的一些非常令人興奮的新一代，Blackwell Ultra再次挑戰(zhàn)極限，推出我提到的下一代Spectrum交換器。

下一個(gè)是我們的另一個(gè)開發(fā)平臺(tái)，代號(hào)Rubin。我不會(huì)用太長(zhǎng)時(shí)間介紹Rubin，大家肯定會(huì)拍照來(lái)看細(xì)節(jié)內(nèi)容。我們有了Rubin平臺(tái)，一年后我們會(huì)有Rubin Ultra平臺(tái)。到時(shí)候所有的產(chǎn)品都將會(huì)百分百兼容。

過去的12年里，從ImageNet讓我們意識(shí)到計(jì)算的未來(lái)將發(fā)生根本性變化，到今天，就像2012年之前的早期GeForce和今天的NVIDIA一樣，這家公司確實(shí)發(fā)生了巨大的變化。我要感謝所有在這里支持我們每一步的合作伙伴。

五、機(jī)器人與數(shù)字孿生及其他

接下來(lái)，我想談?wù)勏乱徊ˋI浪潮——物理AI，即理解物理定律的AI。

AI可以在我們之間工作，因此它們必須理解世界模型，以便解釋和感知世界。當(dāng)然，它們還必須具備出色的認(rèn)知能力，這樣才能理解我們的要求，并在未來(lái)執(zhí)行任務(wù)。

機(jī)器人技術(shù)是一個(gè)更普遍的概念。當(dāng)我說機(jī)器人時(shí)，通常指人形機(jī)器人，但事實(shí)并非如此。所有的工廠都將是機(jī)器人員工，工廠將安排機(jī)器人工作，這些機(jī)器人將建造機(jī)器人產(chǎn)品，并與機(jī)器人互動(dòng)。為了實(shí)現(xiàn)這一點(diǎn)，我們需要取得一些突破。

總有一天，所有移動(dòng)的東西都將是自主的。世界各地的研究人員和公司正在開發(fā)由物理人工智能驅(qū)動(dòng)的機(jī)器人。物理AI是能夠理解指令的模型，一個(gè)自主機(jī)器人在現(xiàn)實(shí)世界中執(zhí)行復(fù)雜的任務(wù)。多模態(tài)大型語(yǔ)言模型是使機(jī)器人能夠?qū)W習(xí)、感知和理解周圍世界，并持續(xù)突破、計(jì)劃如何行動(dòng)的關(guān)鍵。

機(jī)器人現(xiàn)在可以學(xué)習(xí)使用粗略和精細(xì)的運(yùn)動(dòng)技能與世界互動(dòng)。推進(jìn)機(jī)器人技術(shù)的一項(xiàng)重要技術(shù)是強(qiáng)化學(xué)習(xí)，就像大型語(yǔ)言模型需要從人類反饋中獲取RLHF（Reinforcement Learning from Human Feedback，即基于人類反饋的強(qiáng)化學(xué)習(xí)）來(lái)學(xué)習(xí)特定技能一樣，物理AI可以利用模擬世界中的物理反饋強(qiáng)化學(xué)習(xí)來(lái)學(xué)習(xí)技能。這些模擬環(huán)境是機(jī)器人通過在遵循物理定律的虛擬世界中執(zhí)行行動(dòng)來(lái)學(xué)習(xí)決策的地方。機(jī)器人可以學(xué)習(xí)復(fù)雜而安全的日常任務(wù)，并通過數(shù)百萬(wàn)次的嘗試和行動(dòng)來(lái)完善他們的技能。

在操作系統(tǒng)上，典型的AI模擬并重新創(chuàng)建。

這是一種發(fā)展嗎？

世界模擬結(jié)合了實(shí)時(shí)、基于Omniverse的物理模擬和生成式AI技術(shù)。機(jī)器人可以學(xué)習(xí)如何成為機(jī)器人，他們學(xué)習(xí)如何自主操縱物體，例如抓取和處理物體，或自主導(dǎo)航環(huán)境，在避開障礙物的同時(shí)找到最佳路徑。在Omniverse中學(xué)習(xí)，將模擬與現(xiàn)實(shí)的差距最小化，最大化學(xué)習(xí)行為的遷移。

建造具有這種能力的機(jī)器人需要三臺(tái)英偉達(dá)AI超級(jí)計(jì)算機(jī)來(lái)訓(xùn)練模型。因此，我們推出了NVIDIA Omniverse，讓機(jī)器人可以學(xué)習(xí)和完善他們的技能。我們構(gòu)建開發(fā)人員和公司所需的平臺(tái)、加速庫(kù)和AI模型，并允許他們使用。

對(duì)他們來(lái)說，這就是下一波人工智能機(jī)器人的浪潮，人工智能的時(shí)代和工業(yè)革命。

我們有幾種方式來(lái)服務(wù)市場(chǎng)。

首先，我們將為每種類型的機(jī)器人系統(tǒng)創(chuàng)建平臺(tái)，一個(gè)用于機(jī)器人工廠和倉(cāng)庫(kù)，一個(gè)用于操縱事物的機(jī)器人，一個(gè)用于移動(dòng)的機(jī)器人，一個(gè)用于人形機(jī)器人。這些機(jī)器人平臺(tái)包括計(jì)算機(jī)加速庫(kù)和預(yù)訓(xùn)練模型，我們測(cè)試一切，訓(xùn)練一切，整合一切。

這里是機(jī)器人學(xué)習(xí)如何成為機(jī)器人的地方。當(dāng)然，現(xiàn)在機(jī)器人倉(cāng)庫(kù)的生態(tài)系統(tǒng)真的非常復(fù)雜。需要很多公司、很多工具、很多技術(shù)來(lái)建造一個(gè)現(xiàn)代化的倉(cāng)庫(kù)。倉(cāng)庫(kù)越來(lái)越趨向自動(dòng)化，直到某一天將會(huì)完全自動(dòng)化。因此，在每個(gè)生態(tài)系統(tǒng)中，我們都有SDKs和APIs連接到軟件行業(yè)，SDKs和APIs連接到邊緣AI行業(yè)和公司。當(dāng)然，還有為PLC設(shè)計(jì)的系統(tǒng)和用于ODM的機(jī)器人系統(tǒng)。然后由集成商集成，最終為客戶建立倉(cāng)庫(kù)。

工廠擁有完全不同的生態(tài)系統(tǒng)，富士康正在建造一些世界上最先進(jìn)的工廠。他們的生態(tài)系統(tǒng)包括用于設(shè)計(jì)工廠、工作流程、為機(jī)器人編程的邊緣計(jì)算機(jī)和機(jī)器人軟件，當(dāng)然還有協(xié)調(diào)數(shù)字工廠和人工智能工廠的PLC計(jì)算機(jī)。我們也有連接到每個(gè)生態(tài)系統(tǒng)的SDKs。這正在各地發(fā)生。富士康已經(jīng)建立了他們工廠的數(shù)字孿生，Delta也正在建立他們工廠的數(shù)字孿生。

Pigatron正在建立他們的機(jī)器人工廠的數(shù)字孿生，Wistron也正在建立他們的機(jī)器人工廠的數(shù)字孿生。這真的很酷。讓我們來(lái)看一看富士康新工廠的視頻。隨著世界將傳統(tǒng)數(shù)據(jù)中心現(xiàn)代化為生成式AI工廠，對(duì)英偉達(dá)加速計(jì)算的需求正在飆升。富士康，世界上最大的電子產(chǎn)品制造商，正準(zhǔn)備通過使用英偉達(dá)Omniverse構(gòu)建機(jī)器人工廠來(lái)滿足這一需求。

霓虹燈工廠規(guī)劃人員使用Omniverse來(lái)整合來(lái)自領(lǐng)先行業(yè)應(yīng)用程序（如西門子Teamcenter）的設(shè)施和設(shè)備數(shù)據(jù)，這些數(shù)據(jù)在數(shù)字孿生中得到充分利用。他們優(yōu)化了地板布局和線路配置，并找到最佳的攝像頭放置位置，以使用英偉達(dá)Metropolis的視覺AI監(jiān)控未來(lái)的運(yùn)營(yíng)。虛擬集成為規(guī)劃人員節(jié)省了施工期間物理變更單的巨大成本。富士康團(tuán)隊(duì)使用數(shù)字孿生作為真相的來(lái)源，以溝通和驗(yàn)證準(zhǔn)確的設(shè)備布局。

Omniverse數(shù)字孿生也是機(jī)器人訓(xùn)練館，在這里，富士康開發(fā)人員培訓(xùn)和測(cè)試Nvidia Isaac AI應(yīng)用程序，用于機(jī)器人感知和操作，以及Metropolis AI應(yīng)用程序，用于Omniverse中的傳感器融合。富士康在將運(yùn)行時(shí)部署到裝配線上的Judson計(jì)算機(jī)之前，模擬了2個(gè)機(jī)器人AI。他們模擬了用于物體識(shí)別、缺陷檢測(cè)和軌跡規(guī)劃的自動(dòng)光學(xué)檢測(cè)的Isaac機(jī)械手庫(kù)和AI模型。

為了轉(zhuǎn)移到測(cè)試機(jī)器人，他們模擬Isaac感知器驅(qū)動(dòng)的Farab AMR，他們通過3D映射和重建感知并在環(huán)境中移動(dòng)。富士康建造了他們的機(jī)器人工廠，這些工廠協(xié)調(diào)運(yùn)行在Nvidia Isaac上的機(jī)器人，以構(gòu)建視頻AI 2計(jì)算機(jī)，從而控制起重機(jī)Vox。所以一個(gè)機(jī)器人工廠設(shè)計(jì)有三臺(tái)計(jì)算機(jī)：在Nvidia AI上訓(xùn)練AI，讓機(jī)器人在PLC系統(tǒng)上運(yùn)行，以協(xié)調(diào)工廠，然后，當(dāng)然，你在Omniverse中模擬一切。

機(jī)械手臂和機(jī)器人的AMRs也是一樣的，三個(gè)計(jì)算機(jī)系統(tǒng)，不同之處在于兩個(gè)Omniverse將會(huì)結(jié)合在一起。所以這些共享一個(gè)虛擬空間。當(dāng)他們共享一個(gè)虛擬空間時(shí)，這個(gè)機(jī)械手臂將進(jìn)入機(jī)器人工廠。

再一次，三臺(tái)計(jì)算機(jī)，我們?yōu)橛?jì)算機(jī)提供加速層和預(yù)訓(xùn)練的AI模型。我們已經(jīng)將Nvidia的機(jī)械手和Nvidia Omniverse與世界領(lǐng)先的工業(yè)自動(dòng)化軟件和系統(tǒng)公司西門子連接起來(lái)。這真的是一個(gè)非常棒的合作關(guān)系。

他們?cè)谑澜绺鞯氐墓S工作。語(yǔ)義拾取AI現(xiàn)在集成了Isaac機(jī)械手和語(yǔ)義拾取AI運(yùn)行，操作ABB、KUKA、Yaskawa、FANUC、Universal Robots和Techman。

我們還有各種其他的集成，例如，Arcbest正在將Isaac感知器集成到Foxx智能自主機(jī)器人中，以增強(qiáng)物體識(shí)別和人類運(yùn)動(dòng)跟蹤。電子產(chǎn)品的運(yùn)動(dòng)跟蹤和材料處理正在將Isaac操縱器和感知器集成到他們的人工智能機(jī)器人中，以提高全球制造效率。

Idealworks正在將Isaac感知器構(gòu)建到他們的iWMS軟件中，用于工廠物流內(nèi)在的AI機(jī)器人。Kivnon正在整合Isaac感知器，以推進(jìn)AI驅(qū)動(dòng)的運(yùn)動(dòng)，以推進(jìn)AI啟用的物流。Argo機(jī)器人正在將Isaac感知器應(yīng)用于基于高級(jí)視覺的感知引擎中。Solomon在他們的AcuPick中使用Isaac操縱器AI模型。

Tattile機(jī)器人正在將Isaac Sim和機(jī)械手引入TMF Web加速自動(dòng)光學(xué)檢測(cè)。Teradyne機(jī)器人正在將Isaac機(jī)械手集成到協(xié)作機(jī)器人的PolyScope X中，并將Isaac感知器集成到MiR AMRs中。Mech-Mind正在將Isaac操作器集成到Mech-Eye工業(yè)3D相機(jī)中，用于AI操作機(jī)器人。

機(jī)器人來(lái)了，物理AI在這里。

這不是科幻小說，它正在各地使用，真的非常令人興奮。那就是工廠，里面的機(jī)器人，所有的產(chǎn)品都將是機(jī)器人。

其中之一是自動(dòng)駕駛汽車或具有大量自主能力的汽車。英偉達(dá)再次構(gòu)建整個(gè)堆棧。明年，我們將與奔馳車隊(duì)一起投入生產(chǎn)。

之后，在2026年，我們向全世界提供完整的JLR艦隊(duì)堆棧。但是，歡迎您取用我們堆棧的任何部分或任何層，就像整個(gè)驅(qū)動(dòng)器堆棧打開一樣。下一個(gè)大批量機(jī)器人產(chǎn)品將由機(jī)器人工廠制造，內(nèi)部有機(jī)器人，可能是人形機(jī)器人。

近年來(lái)，由于基礎(chǔ)模型的出現(xiàn)，這在認(rèn)知的能力和我們正在開發(fā)的世界理解能力方面都有了很大的進(jìn)步。我對(duì)這個(gè)領(lǐng)域感到非常興奮，最容易適應(yīng)這個(gè)世界的機(jī)器人是人類機(jī)器人，因?yàn)槲覀優(yōu)槲覀兘ㄔ炝诉@個(gè)世界。

我們還需要比其他類型的機(jī)器人更大量的數(shù)據(jù)來(lái)訓(xùn)練這些機(jī)器人，因?yàn)槲覀儞碛邢嗤纳韺W(xué)。訓(xùn)練數(shù)據(jù)，我們可以通過演示功能和視頻功能提供，這將是非常棒的。

因此，我們將在這個(gè)領(lǐng)域看到很多進(jìn)展。事實(shí)證明，這項(xiàng)技術(shù)與當(dāng)今已經(jīng)構(gòu)建的所有其他計(jì)算機(jī)的構(gòu)建技術(shù)非常相似。所以這對(duì)我們來(lái)說將是一段非常非凡的旅程。

本文由人人都是產(chǎn)品經(jīng)理作者【硅星人】，微信公眾號(hào)：【硅星人Pro】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自黃仁勛演講現(xiàn)場(chǎng)照片

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App