英偉達(dá)，你還有多少驚喜是我們不知道的

第一電動(dòng)大牛作者智車星球 2023-03-22 14:50

iPhone，早已不僅僅是一個(gè)名詞，更多時(shí)候，它被作為形容詞來(lái)使用，用來(lái)形容被顛覆、新時(shí)代到來(lái)的時(shí)刻。

在一年一度的英偉達(dá)GTC大會(huì)上，英偉達(dá)CEO黃仁勛三次強(qiáng)調(diào)AI的“iPhone時(shí)刻”已經(jīng)到來(lái)，這也很好地呼應(yīng)了這次大會(huì)的宣傳語(yǔ)——切勿錯(cuò)過(guò)，AI的決定性時(shí)刻。

那么，這次老黃帶來(lái)了哪些前沿的技術(shù)和產(chǎn)品？他們又能否承擔(dān)起“AI的iPhone時(shí)刻”這個(gè)描述呢？

—

讓ChatGPT快10倍的H100 NVL

英偉達(dá)的主場(chǎng)，自然離不開(kāi)GPU。

此次，英偉達(dá)推出了全新GPU推理平臺(tái)，包括了L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper超級(jí)芯片四種配置。這四種配置分別用于加速AI視頻、圖像生成加速、大型語(yǔ)言模型加速（LLM）和推薦系統(tǒng)。

其中L4 Tensor Core GPU是針對(duì)AI視頻設(shè)計(jì)的通用GPU，可提供比CPU高120倍的AI視頻性能，能效提高99%。同時(shí)，優(yōu)化了視頻解碼與轉(zhuǎn)碼、視頻內(nèi)容審核、視頻通話等功能，如背景替換、重新打光、眼神交流、轉(zhuǎn)錄和實(shí)時(shí)翻譯等。一臺(tái)8-GPU L4服務(wù)器將取代100多臺(tái)用于處理AI視頻的雙插槽CPU服務(wù)器。

據(jù)悉，Google Cloud會(huì)是首批集成L4的公司之一，谷歌會(huì)通過(guò)其Vertex AI平臺(tái)向客戶提供L4的服務(wù)。

L40 GPU則是用于圖像生成，針對(duì)2D、3D圖像生成進(jìn)行了優(yōu)化，且能結(jié)合Omniverse直接生成3D甚至元宇宙內(nèi)容，其推理性能是英偉達(dá)云推理GPU T4的10倍。

Grace Hopper超級(jí)芯片則適用于推薦系統(tǒng)和大型語(yǔ)言模型的AI數(shù)據(jù)庫(kù)，是圖推薦模型、向量數(shù)據(jù)庫(kù)和圖神經(jīng)網(wǎng)絡(luò)的理想選擇。它可以通過(guò)900GB/s的高速一致性芯片到芯片接口連接英偉達(dá)Grace CPU和Hopper GPU。

最后是采用了Transformer加速解決方案、可用于處理ChatGPT的H100 NVL。這款專門(mén)用于訓(xùn)練大型語(yǔ)言模型的GPU是基于去年英偉達(dá)發(fā)布的H100的改進(jìn)版本，它將兩張擁有94GB HBM3顯存的PCIe H100 GPU通過(guò)NVLink拼接在一起，支持188GB HBM3內(nèi)存?？商幚?yè)碛?750億參數(shù)的GPT-3大模型，同時(shí)支持商用PCIe服務(wù)器輕松擴(kuò)展。

據(jù)黃仁勛介紹，目前適用于GPT-3處理的HGX A100，是云上唯一可以實(shí)際處理ChatGPT的GPU，但一臺(tái)搭載4對(duì)H100及雙GPU NVLink的標(biāo)準(zhǔn)服務(wù)器的速度，比HGX A100還要快10倍，這意味著H100 NVL可以把大型語(yǔ)言模型的處理成本降低一個(gè)數(shù)量級(jí)。

—

光刻計(jì)算庫(kù)，讓光刻機(jī)效率提升40倍

除了在產(chǎn)品層面帶來(lái)更高性能的GPU，英偉達(dá)還從制造層面帶來(lái)了新武器——光刻計(jì)算庫(kù)NVIDIA cuLitho，一套可以集成在NVIDIA Hopper架構(gòu)中的光刻庫(kù)。

NVIDIA Hopper是去年GTC上英偉達(dá)帶來(lái)的全新GPU架構(gòu)，并基于該架構(gòu)推出了首個(gè)產(chǎn)品英偉達(dá)H100。該產(chǎn)品已經(jīng)在短短一年時(shí)間里成為各大科技訓(xùn)練人工智能模型使用最多的GPU之一。

NVIDIA cuLitho可以通過(guò)計(jì)算技術(shù)大幅優(yōu)化芯片制造流程，利用GPU技術(shù)實(shí)現(xiàn)計(jì)算光刻，可以使傳統(tǒng)光刻技術(shù)提速40倍以上，為2nm及更先進(jìn)芯片的生產(chǎn)提供助力，幫助GPU提高在芯片制造場(chǎng)景中的工作效率。

黃仁勛在演講中透露，英偉達(dá)目前已經(jīng)和AMSL、臺(tái)積電以及新思科技建立了合作關(guān)系，ASML計(jì)劃將搭載了NVIDIA cuLitho軟件庫(kù)的NVIDIA Hopper GPU集成在他們所生產(chǎn)的光刻機(jī)設(shè)備中去。

“使用NVIDIA cuLitho軟件庫(kù)加上NVIDIA Hopper GPU替代目前光刻機(jī)上使用的CPU，整體的效率可以提升40倍左右，減少目前每年消耗數(shù)百億CPU小時(shí)的大量計(jì)算工作負(fù)載?！?黃仁勛介紹道，“臺(tái)積電可以通過(guò)在500個(gè)DGX H100系統(tǒng)上使用cuLitho加速，將功率從35MW降至5MW，替代用于計(jì)算光刻的40000臺(tái)CPU服務(wù)器。”

—

云上英偉達(dá)

最后我們?cè)俚奖敬蜧TC的另一個(gè)重頭戲——云上看一看。

英偉達(dá)這次帶來(lái)了一項(xiàng)名為DGX Cloud的AI超級(jí)計(jì)算服務(wù)，搭配NVIDIA AI軟件，就能讓企業(yè)可以通過(guò)一個(gè)Web瀏覽器就能訪問(wèn)AI超算，消除了獲取、部署和管理本地基礎(chǔ)設(shè)施的復(fù)雜性，以便企業(yè)為生成式AI和其他開(kāi)創(chuàng)性應(yīng)用，訓(xùn)練先進(jìn)的模型。

目前，該服務(wù)已與微軟Azure、谷歌OCP、Oracle OCI合作，用戶可以租用DGX Cloud的月租為36999美元起。

除了算力，通過(guò)云服務(wù)，英偉達(dá)還開(kāi)發(fā)了一系列的應(yīng)用模型，這些模型為特定領(lǐng)域的任務(wù)創(chuàng)建，通過(guò)專有的數(shù)據(jù)進(jìn)行訓(xùn)練，旨在把大模型創(chuàng)造的能力交給更多用戶。基于此，英偉達(dá)宣布NVIDIA AI Foundations模型，涵蓋NVIDIA NeMo語(yǔ)言模型、視覺(jué)模型Picasso和生物學(xué)模型BIONEMO。

NeMo是文本生成模型構(gòu)建服務(wù)，能提供80億、430億、5300億參數(shù)的模型，并定期更新額外的訓(xùn)練數(shù)據(jù)，幫助企業(yè)為客服、企業(yè)搜索、聊天機(jī)器人、市場(chǎng)情報(bào)等生成式AI應(yīng)用進(jìn)行模型定制。

Picasso是視覺(jué)語(yǔ)言模型構(gòu)建服務(wù)，具有先進(jìn)的文生圖、文本轉(zhuǎn)視頻、文本轉(zhuǎn)3D功能，可為產(chǎn)品設(shè)計(jì)、數(shù)字孿生、角色創(chuàng)建等使用自然文本提示的應(yīng)用快速創(chuàng)建和定制視覺(jué)內(nèi)容。目前英偉達(dá)已經(jīng)與Shutterstock合作，開(kāi)發(fā)了Edify-3D生成式AI模型。

BioNeMo為生命科學(xué)服務(wù)，提供AI模型訓(xùn)練和推理，加速藥物研發(fā)中最耗時(shí)和成本最高的階段，可加速新蛋白質(zhì)和治療方法的創(chuàng)建以及基因組學(xué)、化學(xué)、生物學(xué)和分子動(dòng)力學(xué)研究。英偉達(dá)與三菱聯(lián)合發(fā)布了將用于加速藥物研發(fā)的日本第一臺(tái)生成式AI超級(jí)計(jì)算機(jī)Tokyo-1。通過(guò)在Tokyo-1上使用BioNeMo軟件，研究人員能運(yùn)行高達(dá)數(shù)十億參數(shù)的先進(jìn)AI模型，包括蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、小分子生成、姿態(tài)估計(jì)等。

—

AI的“iPhone時(shí)刻”

過(guò)去短短幾個(gè)月，從ChatGPT推出、GPT-4發(fā)布、百度文心一言跟進(jìn)發(fā)布到微軟發(fā)布AI助手Microsoft 365 Copilot、Midjourney發(fā)布能“畫(huà)手指”的V5版本……AI技術(shù)刮起了一陣陣旋風(fēng)，這些風(fēng)不僅吹到了行業(yè)里，更影響到了每一個(gè)普通人。

AI的“iPhone時(shí)刻”，此言不虛。

在這個(gè)AI時(shí)刻，自動(dòng)駕駛，甚至是整個(gè)汽車行業(yè)都顯得有些暗淡。

在黃仁勛一個(gè)多小時(shí)的演講中，汽車領(lǐng)域只在談及Omniverse時(shí)有所提及。據(jù)黃仁勛介紹，這個(gè)虛擬世界仿真引擎不是一種工具，而是一個(gè)USD網(wǎng)絡(luò)和共享數(shù)據(jù)庫(kù)，也是與各行各業(yè)使用的設(shè)計(jì)工具相連接的基礎(chǔ)結(jié)構(gòu)。其一大用處是讓企業(yè)在實(shí)際建設(shè)工廠、生產(chǎn)產(chǎn)品前，通過(guò)數(shù)字化模擬“預(yù)覽”實(shí)際的成品。

奔馳、沃爾沃、豐田、Lotus等多家車企已經(jīng)在使用Omniverse構(gòu)建自己工廠的數(shù)字孿生、為新車型構(gòu)建、優(yōu)化和規(guī)劃組裝流水等。

這也讓筆者想起此前與國(guó)內(nèi)某3D引擎企業(yè)交流時(shí)，對(duì)方談到，相比Unity、Unreal，英偉達(dá)才是那個(gè)真正可怕的對(duì)手。

確實(shí)，別人引以為傲的單點(diǎn)能力，在英偉達(dá)這里，只是其以AI為核心構(gòu)建的技術(shù)產(chǎn)品帝國(guó)中的一環(huán)。

以點(diǎn)擊面，難度何其大。

曾經(jīng)的PC時(shí)代，英偉達(dá)只是配角，移動(dòng)時(shí)代也黯然離場(chǎng)。如今，AI大風(fēng)刮來(lái)，英偉達(dá)也終于成為了人工智能這場(chǎng)新時(shí)代大戲的主角。

大風(fēng)愈刮愈烈，能把英偉達(dá)送到多高，我們且一起看看。同時(shí)，我們也期待著，這場(chǎng)大戲中能出現(xiàn)更多動(dòng)人的角色與劇情。

來(lái)源：第一電動(dòng)網(wǎng)

作者：智車星球

本文地址：http://www.155ck.com/kol/198092

返回第一電動(dòng)網(wǎng)首頁(yè) >

文中圖片源自互聯(lián)網(wǎng)，如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com（#替換成@）刪除。