| 2024 NVIDIA CEO黃仁勳 台大演講:AI如何帶動全球新產業革命發展 |
| |
|
| |
|
 |
3348 |
|
| 最後更新時間:6月 | 3日 , 2024 |
|
| |
 |
 |
|
|
| 輝達(NVIDIA)執行長黃仁勳6/2晚上在台大體育館發表演講,主題圍繞著NVIDIA在計算領域的多元應用及其領先技術,涵蓋了NVIDIA在加速計算和AI領域的突破、如何利用AI和物理仿真技術創建大型的地球的數位攣生系統、生成式AI技術的創新突破、NVIDIA最新的Blackwell架構以及未來的AI工廠等,並展示了這些技術落地的應用實例。 |
| |

NVIDIA在加速計算和AI領域的突破
隨著傳統中央處理單元(CPU)性能增長的放緩,加速計算已成為應對日益增長的計算需求的關鍵解決方案。黃仁勳指出,一般PC用的CPU的性能增長已經明顯放緩,因為無法跟上計算需求的快速增長。他提到,如果計算需求繼續指數增長,而CPU性能無法相應提高,我們將面臨「計算通脹」的問題,這意味著計算成本和能耗會急劇增加,並將對數據中心的營運產生巨大壓力。
為了解決這一問題,NVIDIA提出了加速計算的概念,透過導入圖形處理單元(GPU)來輔助和加速CPU的工作。黃仁勳解釋說,GPU能夠並行處理大量計算任務,特別適合於圖形處理、影像處理、物理模擬和深度學習等需要高平行度的算法。他隨即展示展示了一個實例,說明了加速計算的驚人效果。一個需要100個單位時間的計算任務,如果僅由CPU來完成,將耗費大量時間和能量。但透過引入GPU,這個任務的處理時間可以縮短到1個單位時間,計算效率提升了100倍,而能耗僅增加了3倍,成本僅增加了50%。

圖:NVIDIA的CUDA技術
CUDA技術和軟體庫
NVIDIA的CUDA(Compute Unified Device Architecture)技術是加速計算的核心。黃仁勳介紹說,CUDA是一個平行計算平台和程式編譯模型,使得開發者可以利用GPU的強大計算能力來加速應用程序。CUDA支援多種並行計算算法,包括線性代數、圖形處理、資料庫處理和深度學習等。為了進一步推動加速計算的普及,NVIDIA開發了350多個專用軟體庫(libraries),涵蓋各個領域的加速計算需求。例如,CU-DNN是針對深度學習的庫,提供了高能效的神經網絡計算支援;CuLitho是計算光刻的庫,用於晶片製造中的高計算量部分;Parabricks是基因測序的庫,提供了世界上最高吞吐量的基因測序能力。

圖:VIDIA的專用軟體庫
黃仁勳強調,加速計算已經在全球範圍內廣泛應用,並展示了多個成功案例。例如,Google在其雲端平台Colab中引入了CUDA技術,顯著加速了Pandas數據科學庫的計算速度。Pandas是全球最受歡迎的數據科學庫,每月下載量達1.7億次。除此之外,NVIDIA的加速計算技術還被應用於科學超級計算中心、醫療健康、金融服務、汽車工業等多個領域,顯示了其強大的計算能力和廣泛的應用前景。
加速計算的挑戰和未來
儘管加速計算具有顯著的優勢,但黃仁勳也提到,實現加速計算並不容易,需要對現有的軟體進行重新設計和編寫,以便充分利用GPU的平行計算能力。他表示,NVIDIA已經花費二十年的時間,逐步開發出一系列專用軟體庫,降低了加速計算的實施難度,但黃仁勳相信隨著加速計算技術的不斷進步,計算成本將持續下降,計算能力將不斷提升,這將為全球科技創新和產業升級帶來新的動力。他預測,未來的每一個計算密集型應用都將被加速,每一個數據中心都將實現加速計算,推動計算技術進入一個全新的時代。

圖:NVIDIA Blackwell平台
NVIDIA Blackwell:次世代AI超級計算平台
接著黃仁勳詳細介紹了NVIDIA最新的Blackwell架構,這是一個專為下一代人工智慧(AI)設計的超級計算平台。黃仁勳介紹說,Blackwell架構的核心是兩個超大規模的晶片,這兩個晶片通過每秒10TB的高速連接互相連結。這些晶片是目前世界上最大的晶片之一,由台積電(TSMC)製造。每個Blackwell晶片包含數百億個晶體管,能夠提供極高的計算性能。

圖:NVIDIA Blackwell架構
Blackwell架構的計算能力驚人,達到了前所未有的高度。黃仁勳展示了一個對比圖,顯示了NVIDIA GPU計算能力的進步:在短短八年間,NVIDIA的計算能力提升了1000倍。這樣的進步使得Blackwell能夠在極短的時間內完成以前需要耗費大量時間和能源的計算任務。

圖:NVIDIA的計算能力提升了1000倍
Blackwell架構引入了第二代Transformer引擎,這是一種專門為深度學習和AI設計的計算引擎。Transformer引擎能夠動態調整計算精度,根據每一層計算的需要選擇最合適的精度,從而大幅提升計算效率。

Blackwell架構使用了第五代NVLink技術,這是一種高頻寬、高速連接技術,能夠將多個GPU連接在一起,形成一個超大規模的計算網絡。每個Blackwell節點還配備了一個灰色CPU,用於快照和重啟操作,並在推理和生成過程中儲存上下文記憶。為了提高系統的可靠性和可用性,Blackwell引入了一個全新的可靠性和可用性引擎,能夠測試每一個晶體管和儲存單元,確保系統的穩定運行。此外,Blackwell還配備了一個資料解壓縮引擎,使得資料處理速度提高了20倍。

圖:Blackwell架構使用了第五代NVLink技術
Blackwell架構被整合到DGX Blackwell系統中,每個系統包含八個Blackwell GPU,並且完全使用空氣冷卻技術。這些系統能夠提供高達15kW的計算能力,並且能夠支持X86架構,與現有的數據中心基礎設施兼容。
對於需要液冷的應用,NVIDIA推出了MGX模塊化系統。這個系統使用了兩個Blackwell板卡,每個板卡包含四個Blackwell GPU,通過液冷技術來散熱。MGX系統能夠將72個Blackwell GPU連接在一起,形成一個超大規模的計算域,提供極高的計算性能。另外,NVLink交換機是Blackwell架構的一個關鍵組成部分,能夠將多個Blackwell GPU連接在一起,形成一個單一的計算域。這些交換機具備極高的資料傳輸速率,並且內建數學運算能力,能夠在晶片內進行深度學習所需的歸約操作。

圖:NVLink Switch Server
黃仁勳表示,Blackwell架構的強大計算能力將使得訓練大型語言模型(如GPT-4)成為可能。黃仁勳展示了一個實例,說明了Blackwell如何在僅使用3GWh的能源下完成以前需要1000GWh才能完成的訓練任務,顯示了其驚人的能效提升。而在推理和生成任務中,Blackwell能夠以極低的能耗生成大量的數據。例如,Blackwell在生成GPT-4的每個token時僅需0.4焦耳的能量,顯著降低了運行成本,並使得大規模AI應用變得更加經濟高效。
黃仁勳強調,Blackwell僅僅是NVIDIA下一代AI計算平台的開始。未來,NVIDIA將繼續推動技術創新,推出性能更強、能效更高的Blackwell Ultra和Rubin平台,這些平台將進一步提升計算能力,降低計算成本,推動全球AI技術的發展。

圖:AI工廠是一種全新的工業模式
未來的AI工廠:NVIDIA的願景與實踐
黃仁勳接著詳細介紹了未來AI工廠的願景,他強調,AI工廠是一種全新的工業模式,它結合了加速計算、人工智慧和數位孿生技術,旨在大幅提高生產效率和降低成本。他詳細說明了AI工廠的幾個關鍵特徵:
全面的自動化:AI工廠內的所有操作都將由機器人和AI系統自動執行,從產品設計到生產,再到質量檢測和物流配送。
數位孿生技術:通過創建物理工廠的數位孿生,企業可以在虛擬環境中模擬和優化生產過程,識別並解決潛在問題,從而降低實際運營中的風險和成本。
即時數據驅動:AI工廠將利用大量的即時數據來驅動決策和優化生產流程,從而提高靈活性和反應速度。
NVIDIA Omniverse 與 NVIDIA的Isaac
接著黃仁勳介紹了NVIDIA Omniverse,NVIDIA Omniverse是AI工廠的核心平台,整合了即時物理渲染、物理模擬和生成式AI技術。Omniverse允許企業在虛擬環境中進行工廠設計、模擬和測試,並能夠顯著縮短產品上市時間,另外一個重點角色,便是NVIDIA的Isaac平台,NVIDIA的Isaac平台專為機器人設計,提供了廣泛的機器人感知、操作和模擬工具。Isaac平台包括Isaac Sim和Isaac SDK,用於模擬機器人操作和訓練AI模型,確保機器人在實際應用中能夠高效運行。
接著黃仁勳介紹了幾家合作夥伴具體應用案例:
鴻海利用NVIDIA的技術在Omniverse中創建其工廠的數位孿生系統。這些數位孿生不僅用於工廠設計和模擬,還用於訓練和測試機器人AI應用。在工廠建設過程中,鴻海使用數位孿生作為溝通和驗證的真實來源,確保設備佈局的準確性,並減少實體變更訂單的成本。

圖:NVIDIA創建大型地球數位孿生系統
NVIDIA的合作夥伴如廣運機械和巨大集團,利用NVIDIA的技術來構建自動化倉庫。這些倉庫配備了AI驅動的機器人,用於處理物料搬運和物流操作。ARCBEST將Isaac Perceptor整合到VoxSmart自主機器人中,提升了物體辨識和人類動作追蹤能力,優化了物料搬運流程。台達、和碩聯合和緯創等公司利用Omniverse和Isaac平台構建其製造工廠的數位孿生,模擬和優化生產流程。比亞迪和Idealworks等公司將Isaac Manipulator和Perceptor整合到其機器人中,以提高全球客戶的製造效率。
黃仁勳強調,AI工廠的發展將推動全球製造業的變革,使工廠能夠更靈活地應對市場需求,提高生產效率並降低成本。未來的AI工廠將具備以下幾個特點:
高度靈活性:AI工廠能夠快速適應不同的生產需求和變化,透過AI和機器人技術實現生產流程的自動化和優化。
節能高效:透過使用高效的加速計算和AI技術,AI工廠能夠顯著降低能源消耗和運營成本,實現可持續發展。
全球協作:AI工廠將成為全球供應鏈的一部分,透過數據和技術的共享,實現跨地域的協同工作和資源優化。
生成式AI:重塑未來的人工智慧技術
接著,黃仁勳詳細介紹了生成式AI(Generative AI),他認為這是一項正在重塑未來人工智慧的革命性技術。生成式AI依賴於深度學習技術,特別是大規模的神經網絡模型,如Transformer架構。這些模型透過訓練大量數據,學習數據中的模式和特徵,從而能夠生成新的內容。黃仁勳提到,NVIDIA的GPU和CUDA技術在訓練這些大規模模型方面發揮了關鍵作用,提供了所需的計算能力和效率。
大型語言模型
大型語言模型(LLMs)是生成式AI的一個重要應用,它們能夠生成自然語言文本。這些模型如GPT-4,透過訓練大量的文本數據,能夠理解和生成具有語義和語法一致性的文本內容。NVIDIA的Blackwell架構提供了訓練和運行這些大型語言模型所需的高效計算平台。

圖:生成式AI多種應用
生成式AI的應用
生成式AI在自然語言處理(NLP)領域具有廣泛應用,包括自動文本生成、對話系統、機器翻譯和文本摘要等。黃仁勳提到,ChatGPT等應用就是生成式AI技術的典型例子,它們能夠理解用戶的語義並生成自然的對話。
黃仁勳提到,生成式AI可以用於創建逼真的圖像和影片。透過學習大量的視覺數據,生成式AI能夠生成高質量的圖像、動畫和影片。這在娛樂、廣告、設計和醫療等領域具有重要應用。例如,NVIDIA的Omniverse平台利用生成式AI技術來創建逼真的數位孿生和虛擬環境。除此之外,生成式AI還可以用於設計領域,如產品設計、建築設計和時尚設計。通過學習設計原則和用戶偏好,生成式AI能夠生成創新的設計方案,幫助設計師快速迭代和優化設計。
在生物醫學領域,生成式AI可以用於蛋白質折疊預測、藥物設計和基因組學研究。這些應用能夠顯著加速科學研究進程,推動新藥物的發現和疾病治療方案的開發。
黃仁勳強調,NVIDIA的GPU和CUDA技術能夠提供所需的高效計算能力,但仍需不斷推進技術創新,以應對不斷增長的數據量和計算需求。生成式AI的模型通常非常複雜,這使得它們的解釋性和透明度成為一個挑戰。研究人員和開發者需要開發新的方法來解釋和理解生成式AI的決策過程,確保其應用的可靠性和安全性。
道德和法律問題
生成式AI的應用涉及一系列道德和法律問題,如數據隱私、版權保護和誤用風險。黃仁勳強調,開發和應用生成式AI技術需要遵循道德準則,確保技術的負責任使用和可持續發展。
黃仁勳在最後強調,NVIDIA的成功離不開持續的技術創新和全球合作夥伴的支持。NVIDIA將繼續投資於前沿技術的研發,並與全球的科技公司、研究機構和產業合作夥伴密切合作,共同推動技術進步和應用落地。NVIDIA正站在技術創新的最前沿,透過其強大的計算平台和先進的AI技術,引領著未來的科技發展。隨著生成式AI、AI工廠和自動駕駛等技術的進一步成熟,NVIDIA將在各行各業中發揮越來越重要的作用,為全球科技進步和經濟發展做出重大貢獻。通過持續的創新和全球合作,NVIDIA將不斷推動計算技術進入新的高度,實現其願景中智慧化的未來。 |
| |
| ※本文圖文非經授權不得轉載,洽詢授權,請E-Mail至contact@aimag.tw[ iDS智慧安防雜誌聲明 ]※ |
| |
| |
|
| |