
英偉達創始人兼首席執行官黃仁勛已確認將于太平洋時間1月6日周一下午6:20,在曼德勒灣的Michelob ULTRA Arena發表其備受矚目的CES 2025主題演講。此次演講將吸引來自全球的科技愛好者和行業專家,共同見證英偉達在技術創新領域的最新進展和未來展望。
為了確保能夠順利參加此次主題演講,參會者需持有有效的CES徽章。我們建議您提前領取徽章,以免現場排隊等候。1月6日晚上7點之前,您可以在曼德勒灣的Bayside Foyer領取徽章,無需額外的門票。座位將分為貴賓、媒體和分析師以及普通入場三排,先到先得,敬請盡早入場。
請注意,為了維護演講現場的秩序和安全,一些行李、電子產品和攝像設備限制將適用。具體場館政策如下:一般與會者(包括參展商和行業與會者)可以攜帶尺寸為12英寸x12英寸x6英寸的袋子入場;普通與會者不允許攜帶較大的包、筆記本電腦/平板電腦和攝像設備;貴賓和持有媒體證件的人員則可以攜帶相關設備入場。所有行李都將接受搜查,請予以配合。
此外,為了保持演示的完整性,請在主題演講期間不要使用熱點。黃仁勛的主題演講將通過流媒體平臺實時播放,包括生活消費電子報、臉譜網、油管(國外視頻網站)和商務化人際關系網等,無法現場參加的觀眾也可以通過這些平臺觀看。
演講活動將按時開始,下午4:30,貴賓、媒體和分析師以及ADA門將開放;下午4點45分,普通入口門將打開;下午6點20分,主題演講正式開始。我們期待您的到來,共同見證英偉達在科技創新領域的輝煌成就!
以下是黃仁勛演講內容節選內容,在保證原意下演講內容有所刪減調整。
黃仁勛:
歡迎來到CES!你們來到拉斯維加斯興奮嗎?
你們喜歡我的夾克嗎?我想和Gary Shapiro(消費者技術協會首席執行官兼副主席)的風格相反。畢竟,我在拉斯維加斯。如果這行不通,如果你們都反對,那就習慣吧。我真心覺得你們得接受這個事實。再過一個小時左右,你們就會喜歡上它了。
回顧非凡的AI旅程
這是一段非凡的旅程,跨越了不平凡的一年,始于1993年。通過NV1,我們的目標是創造一種能做普通計算機做不到的事情的機器。NV1讓在個人電腦中擁有游戲主機成為了可能。我們的編程架構叫UDA,后來才加上了字母C,但UDA代表的是統一設備架構。第一個使用UDA的開發者,以及首個在UDA平臺上運行的應用程序,便是世嘉的《VR戰士》。
六年后的1999年,我們發明了可編程GPU,開啟了20多年的驚人進步。這款革命性的處理器,被稱為GPU,成就了現代計算機圖形學的基礎。如今30年后,世嘉的《VR戰士》已經達到了電影級的水準。而即將發布的新虛擬項目,更是讓人期待不已,簡直令人難以置信。
1999年之后的六年,我們發明了CUDA,它使我們能夠以一組豐富的算法來解釋和利用GPU的可編程性,進而實現其潛力。CUDA最初很難解釋,并且花了相當長的時間去發展,實際上,我們花費了大約六年的時間。直到2012年,Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton發現了CUDA,并利用它進行AlexNet的訓練。從那時起,AI的歷史就已發生了根本性的轉變。
自那時以來,人工智能的發展速度飛快。憑借感知AI,我們能夠理解圖像、文字和聲音;隨著生成式AI的發展,我們能夠生成圖像、文字和聲音。而現在,代理AI不僅能感知、推理、規劃,還能行動。接下來,我們將進入下一個階段,其中一些我們今晚將討論的內容,便是物理AI。
接著在2018年,發生了一些不可思議的事情。谷歌發布了Transformer,這一技術讓AI領域真正迎來了飛躍。正如大家所知,Transformer徹底改變了人工智能的格局,甚至改變了計算的格局。我們意識到,AI不僅僅是一個新的應用領域和商業機會,更重要的是,Transformer推動的機器學習將徹底重塑計算的方式。
如今,計算在各個層面都發生了革命性變化,從手動編寫的CPU指令,到如今人類使用的軟件工具。我們現在擁有可以創建和優化神經網絡的機器學習,這些網絡運行在GPU上,并推動人工智能的進步。技術棧中的每一層都經歷了翻天覆地的變化,短短12年內,我們見證了不可思議的轉型。
如今,我們幾乎可以理解任何形式的信息。你肯定見過文本、圖像和聲音等內容,但不僅僅限于這些,我們還能夠理解氨基酸和物理現象。我們可以解讀這些信息,翻譯它們并生成新的內容。應用的可能性幾乎是無限的。
實際上,幾乎所有AI應用都可以通過這三個基本問題來推測:它學習時輸入的模態是什么?它將信息轉化成了什么模態?它正在生成什么模態的信息?只要你問這三個基本問題,幾乎每一個應用的核心都能被揭示。
因此,每當你看到一個又一個以AI為驅動和核心的應用時,始終不變的概念便是:機器學習改變了每個應用的構建方式,改變了計算的方式,甚至超越了GPU本身的可能性。在許多方面,所有這些與AI相關的技術,都由GeForce構建而成。GeForce讓AI走向大眾,而今天,AI正回歸GeForce。
算力需求依然迫切,Blackwell全面投產
整個行業都在追趕并競相擴大AI的規模。Scaling Law是一個經過幾代研究人員與業界驗證的經驗法則。它表明,隨著訓練數據量的增加、模型規模的擴大,以及計算能力的提升,AI模型的有效性與能力也將不斷增強。因此,規模定律的有效性是持續存在的。
更為驚人的是,互聯網每年生成的數據量大約是上一年數據的兩倍。我預測,在未來幾年,全球人類所生成的數據總量將會超過人類歷史上所有數據的總和。我們依舊在生成海量數據,且這些數據變得更加多模態,包括視頻、圖像和聲音等。這些數據無疑為AI提供了豐富的訓練基礎和核心素材。
然而,除了Scaling Law之外,還出現了兩條新的規模定律,它們各自有著直觀的意義。
第二條Scaling Law被稱為后訓練Scaling Law。這條定律依托于強化學習和人工反饋等技術手段。基本上,AI會根據人類的查詢生成答案,而人類則給予反饋,從而促進AI在特定領域的能力提升。它們可以在特定領域進行微調,使其更擅長解數學題、推理等方面。這個過程就像是學生在學校學習后,導師或教練給你反饋,幫助你改進自己。
此外,還擁有強化學習的AI反饋,以及合成數據生成。這些類似于自我練習時,你知道某個問題的答案,會繼續嘗試直到答對。AI可能需要解決一個復雜且可驗證的難題,諸如證明某個定理或解決幾何問題。通過強化學習,它將學會如何更好地改進自己。盡管這一過程計算量龐大,但最終能夠產生極為出色的模型。
第三條Scaling Law則與所謂的“測試時間scaling”相關。測試時間scaling指的是在AI應用時,它能夠智能地分配資源,而不僅僅是改進其參數。AI能夠決定使用多少計算量來生成它想要的答案。
推理就是這種思維方式的一部分。與直接推理或一次性回答不同,AI可能會進行長時間思考,將問題分解為多個步驟,生成不同的思路并加以評估。當前,測試時間scaling已被證明是極其有效的。
隨著這些技術的逐步發展,我們能夠看到從ChatGPT o1,再到o3以及Gemini Pro等一系列AI系統的進化。這些系統正在經歷從預訓練到后訓練,再到測試時間scaling的不斷發展。
因此,所需的計算能力顯然是巨大的。我們不僅希望社會具備擴展計算能力的能力,更期待能夠通過這一擴展,創造出更多創新且更強大的智能系統。畢竟,智能是我們最寶貴的資產,它可以幫助我們解決許多復雜而具有挑戰性的問題。
正因如此,Scaling的不斷增長催生了對英偉達計算技術的巨大需求。這股需求推動了Blackwell這款革命性芯片的廣泛應用。Blackwell已經全面投入生產,其表現令人贊嘆。
首先,幾乎所有云服務提供商都已經在部署相關系統。我們目前已有約15家計算機制造商提供系統,這些系統涵蓋了大約200種不同的SKU和配置,包括液冷、風冷、x86架構、Nvidia Grace CPU、NVL36、NVL72等多種類型。這樣的多樣性使我們能夠滿足全球幾乎所有數據中心的需求。如今,這些系統正在全球45個工廠中進行生產,充分體現了AI的普及程度,以及整個行業在這一全新計算模型下的快速進步。推動這一進程的核心動力就是:我們迫切需要更多的計算能力。
當前這一代Blackwell芯片,在計算能力方面比上一代提高了四倍每瓦的性能和三倍每美元的性能。這意味著在同樣的計算成本下,我們能訓練更大的模型,或者以更低的成本訓練同樣規模的模型。
而最為關鍵的是,這些系統正在生成的tokens,正是我們在使用ChatGPT、Gemini,甚至未來使用智能手機時所依賴的。這些應用幾乎都在消耗這些AI tokens,而這些tokens的生成正是由Blackwell等系統提供的。每個數據中心都有電力的制約。因此,如果Blackwell每瓦的性能比上一代提升四倍,那么這些系統能夠帶來的商業收入和數據中心的處理能力也將成倍增長。這使得如今的AI計算設施,不僅是數據中心的一部分,實際上已經成為了全新的“工廠”。
因此,我們需要大量的計算資源,以訓練更大、更復雜的模型。未來的推理方式將不再局限于簡單的“一次性推理”,AI將開始與自身進行對話、思考、反思和內在處理。這樣的轉變將大大提升AI的推理能力和智能水平。
正如你可以預見的那樣,AI能夠處理的tokens數量將成指數增長。因此,我們亟需大幅提升tokens的生成速度,同時顯著降低計算成本,確保服務質量始終處于高水平,客戶成本得以控制,AI系統也能夠持續擴展。這正是我們開發NVLink系統的核心原因之一。
AI代理興起,創造數百萬美元的市場機會
在企業領域中,正在發生的最重要的事情之一就是AI代理的興起。AI代理由多個模型組成,分工明確。
例如,一部分模型負責與客戶或用戶進行互動,另一部分則負責信息檢索,從存儲中提取數據。像RAG這樣的語義AI系統可能會訪問互聯網、研究PDF文件、使用計算器,甚至利用生成性AI生成圖表等內容。AI代理通過逐步迭代的方式處理問題,將復雜的問題分解成更小的任務,并由不同的模型分別進行處理。
為了幫助行業構建AI代理,我們的市場策略并不直接面向企業客戶,而是與IT生態系統中的軟件開發者合作,通過整合我們的技術來創造新的能力。就像我們曾經與CUDA庫合作一樣,我們現在希望在AI庫領域實現同樣的目標。過去,計算模型中有API來處理計算機圖形學、線性代數、流體動力學等任務,而未來,基于這些加速庫,可能會出現專門的AI加速庫。
為幫助生態系統構建具備自主能力的AI,我們創建了幾項關鍵技術:
NVIDIA NIM:這是一個AI微服務,已經打包并準備就緒,能處理所有復雜的軟件任務。它將模型打包、優化,并放入容器中,用戶可以將其帶到任何地方。我們目前已有適用于視覺、語言理解、語音、動畫、數字生物學的模型,并且即將發布一些關于物理AI的新興模型。
NVIDIA NeMo:本質上是一個數字員工的入職和培訓系統,旨在讓AI代理成為數字勞動力,與員工一同工作并代為處理任務。就像員工入職培訓一樣,我們為這些AI代理提供了不同的庫,幫助它們根據公司特定的語言、流程和工作方式進行培訓。您可以向AI代理提供工作樣本,它們會試圖生成類似的結果,您再進行反饋并持續優化。同時,您還可以設置一些限制和權限,確保代理的行為符合規范。
整個流程——即數字員工的管理和發展過程——被稱為NeMo。從某種意義上講,未來每個公司的IT部門將轉變為AI代理的“HR部門”,負責管理、培訓、入職以及提升這些數字員工。
目前,IT部門主要負責管理和維護各種來自IT行業的軟件系統。但未來,隨著AI技術的普及,IT部門將承擔更多的職責,包括管理、培養、入職以及提升大批數字代理,并將這些代理部署到公司各個部門使用。
未來,每一位軟件工程師都有可能配備一個AI助手。全球有3000萬軟件工程師,未來每個工程師都將借助AI助手進行編程。如果沒有AI的輔助,生產力和代碼質量將大幅下降。而在全球的10億知識工作者中,AI代理很可能成為下一個爆發的行業,并且可能會創造出數百萬美元的市場機會。
創建世界模型,未來工廠將擁有數字孿生體
當你為大型語言模型提供上下文和提示時,模型則一次生成一個token以產生輸出。這是其工作原理。假設不是一個問題提示,而是一個行動請求呢?比如“過去把那個箱子拿過來。”在這種情況下,生成的就不是文本的token,而是行動的token。
我剛剛描述的,是未來機器人技術的一個非常合理的方向,而這項技術已經迫在眉睫。但我們需要做的是,創建一個有效的世界模型,而不是像GPT那樣僅僅是語言模型。這個世界模型必須理解世界的語言,還必須理解物理動態,比如重力、摩擦力和慣性。它必須理解幾何和空間關系,必須理解因果關系。
如果你把物體掉到地上,或者推動物體讓它傾倒時,模型應該能夠理解物體的恒常性。如果你把一個球從廚房臺面上滾過,它掉到另一邊,并沒有進入另一個量子宇宙,而是依然處于那個空間里。
這些類型的直覺理解是當今大多數模型所無法做到的。因此,我們希望創造一個全新的世界。我們需要一個世界基礎模型。今天,我們宣布一項重要的進展——Nvidia Cosmos,一個專注于理解物理世界的世界基礎模型。
Nvidia Cosmos是全球首個世界基礎模型,經過2000萬小時視頻的訓練。這些視頻專注于物理動態內容,例如自然現象、行走的人、移動的手、操控物體,以及快速的攝像機運動。它的真正目標是讓AI理解物理世界,而不僅僅是生成創意內容。通過這個物理AI,我們能夠進行許多下游應用。
我們可以生成合成數據來訓練其他模型,也能為機器人模型奠定基礎。它可以生成多個物理上可行的未來場景,基本上就像《奇異博士》中的場景一樣,因為這個模型理解物理世界,生成的圖像也是物理一致的。這個模型還能夠自動生成字幕,將視頻內容轉化為字幕,從而為大語言模型和多模態語言模型的訓練提供數據。利用這個技術,我們能夠用基礎模型來訓練機器人及大型語言模型。
這就是Nvidia Cosmos。該平臺包括一個自回歸模型,支持實時應用;一個擴散模型,生成高質量圖像;一個強大的分詞器,學習現實世界的詞匯;以及一個數據管道,便于你將這些技術應用到你自己的數據中。我們已經加速了整個過程。因此,這也是全球首個加速的數據處理管道,也是AI加速的管道,所有這些都包含在Cosmos平臺中。今天,我們宣布Cosmos已經開源,并可以通過GitHub獲取。
我們希望,Cosmos的開放能夠像Llama 3對企業AI的貢獻一樣,為機器人技術和工業AI領域做出重大貢獻。
真正的魔力出現在你將Cosmos與Omniverse連接時。根本原因在于,Omniverse是一個基于物理的模擬系統,它并不只是模擬物理現實,而是基于算法物理和原理物理的系統。它是一個模擬器。當你將其與Cosmos結合時,Omniverse為Cosmos提供了一個堅實、真實的基礎,這使得Cosmos能夠輸出基于真理的內容。這正是將大型語言模型與檢索增強生成系統結合的思路。你希望將AI生成的內容與真實世界的基礎連接起來。因此,這兩者的結合提供了一個物理模擬的、多維度的生成器,應用場景令人激動。
顯而易見,對于機器人技術和工業應用而言,Cosmos加Omniverse代表了構建機器人系統所需的第三臺計算機。每個機器人公司最終都必須構建三維計算機——一種用于訓練AI的計算機,我們稱之為DGX計算機;一種用于部署AI的計算機,我們稱之為AGX,它可以安裝在汽車、機器人或AMR(自動移動機器人)中,或者部署在體育場等地方,這些計算機在邊緣運行并具備自主性。但為了連接這兩者,你需要一個數字孿生體。所有這些就是你所看到的模擬。數字孿生體是已訓練的AI模型進行實踐、精煉的地方,用于生成合成數據、強化學習反饋等。
這三臺計算機將協同工作,這正是英偉達針對工業界的戰略。未來,所有的一切都將在模擬中完成。每個工廠都會有一個數字孿生體,與實際工廠完全一致。實際上,你可以使用Omniverse與Cosmos生成大量的未來場景,然后由AI決定哪些場景最適合各種KPI。這將成為程序的約束條件,并能夠部署到現實工廠中。
機器人的“ChatGPT時刻”即將到來
通用機器人技術的“ChatGPT時刻”即將到來。實際上,所有我剛才提到的使能技術將在未來幾年內推動通用機器人領域發生迅速且令人震驚的突破。
通用機器人技術之所以如此關鍵,是因為,盡管許多機器人依賴履帶或輪子并且需要特定的環境來適應,但有三類機器人我們可以制造出來,它們不需要在綠色田野環境中運行,也不需要特別為現有環境做適配。
這三類機器人分別是:第一,代理機器人和代理AI,它們作為信息工作者,只需要能夠適應我們辦公室中的計算機即可;第二,自駕車,因為我們已經花費了超過100年的時間來建設道路和城市;第三,人形機器人。如果我們能夠解決這三項技術,它們將成為全球最龐大的技術產業。因此,我們堅信機器人時代離我們已經不遠。
關鍵的挑戰在于如何訓練這些機器人。尤其在人形機器人領域,模仿信息的收集過程相當復雜。以汽車為例,訓練相對簡單,因為我們每天都在開車。然而對于人形機器人來說,收集人類行為的示范信息就變得非常繁瑣。
因此,我們需要找到一種巧妙的方法,利用人工智能和Omniverse,將數百個示范、成千上萬的人類示范轉化為數百萬個合成動作。通過這些合成動作,AI可以學習如何執行任務。Nvidia Isaac Group,是我們為機器人行業提供的技術平臺基礎設施,旨在加速通用機器人技術的發展。
讓我再說一遍,我們正在生產三款新的Blackwell。令人振奮的是,全球首個物理AI基礎模型,一個強大的AI基礎性模型已經問世,能夠激活全球各行各業,尤其是機器人產業。與此同時,還在三款機器人正在開發,分別是智能代理AI、人形機器人和自動駕駛汽車。過去的一年真是不可思議,我要感謝大家的合作,感謝你們的到來。
祝大家CES愉快,新年快樂,謝謝!
原創文章,作者:小科同學,如若轉載,請注明出處:http://www.bdzhitong.com/article/701319.html