iPhone,早已不僅僅是一個(gè)名詞,更多時(shí)候,它被作為形容詞來(lái)使用,用來(lái)形容被顛覆、新時(shí)代到來(lái)的時(shí)刻。
在一年一度的英偉達(dá)GTC大會(huì)上,英偉達(dá)CEO黃仁勛三次強(qiáng)調(diào)AI的“iPhone時(shí)刻”已經(jīng)到來(lái),這也很好地呼應(yīng)了這次大會(huì)的宣傳語(yǔ)——切勿錯(cuò)過(guò),AI的決定性時(shí)刻。
那么,這次老黃帶來(lái)了哪些前沿的技術(shù)和產(chǎn)品?他們又能否承擔(dān)起“AI的iPhone時(shí)刻”這個(gè)描述呢?
1
—
讓ChatGPT快10倍的H100 NVL
英偉達(dá)的主場(chǎng),自然離不開(kāi)GPU。
此次,英偉達(dá)推出了全新GPU推理平臺(tái),包括了L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper超級(jí)芯片四種配置。這四種配置分別用于加速AI視頻、圖像生成加速、大型語(yǔ)言模型加速(LLM)和推薦系統(tǒng)。
其中L4 Tensor Core GPU是針對(duì)AI視頻設(shè)計(jì)的通用GPU,可提供比CPU高120倍的AI視頻性能,能效提高99%。同時(shí),優(yōu)化了視頻解碼與轉(zhuǎn)碼、視頻內(nèi)容審核、視頻通話等功能,如背景替換、重新打光、眼神交流、轉(zhuǎn)錄和實(shí)時(shí)翻譯等。一臺(tái)8-GPU L4服務(wù)器將取代100多臺(tái)用于處理AI視頻的雙插槽CPU服務(wù)器。
據(jù)悉,Google Cloud會(huì)是首批集成L4的公司之一,谷歌會(huì)通過(guò)其Vertex AI平臺(tái)向客戶提供L4的服務(wù)。
L40 GPU則是用于圖像生成,針對(duì)2D、3D圖像生成進(jìn)行了優(yōu)化,且能結(jié)合Omniverse直接生成3D甚至元宇宙內(nèi)容,其推理性能是英偉達(dá)云推理GPU T4的10倍。
Grace Hopper超級(jí)芯片則適用于推薦系統(tǒng)和大型語(yǔ)言模型的AI數(shù)據(jù)庫(kù),是圖推薦模型、向量數(shù)據(jù)庫(kù)和圖神經(jīng)網(wǎng)絡(luò)的理想選擇。它可以通過(guò)900GB/s的高速一致性芯片到芯片接口連接英偉達(dá)Grace CPU和Hopper GPU。
最后是采用了Transformer加速解決方案、可用于處理ChatGPT的H100 NVL。這款專門(mén)用于訓(xùn)練大型語(yǔ)言模型的GPU是基于去年英偉達(dá)發(fā)布的H100的改進(jìn)版本,它將兩張擁有94GB HBM3顯存的PCIe H100 GPU通過(guò)NVLink拼接在一起,支持188GB HBM3內(nèi)存??商幚?yè)碛?750億參數(shù)的GPT-3大模型,同時(shí)支持商用PCIe服務(wù)器輕松擴(kuò)展。
據(jù)黃仁勛介紹,目前適用于GPT-3處理的HGX A100,是云上唯一可以實(shí)際處理ChatGPT的GPU,但一臺(tái)搭載4對(duì)H100及雙GPU NVLink的標(biāo)準(zhǔn)服務(wù)器的速度,比HGX A100還要快10倍,這意味著H100 NVL可以把大型語(yǔ)言模型的處理成本降低一個(gè)數(shù)量級(jí)。
2
—
光刻計(jì)算庫(kù),讓光刻機(jī)效率提升40倍
除了在產(chǎn)品層面帶來(lái)更高性能的GPU,英偉達(dá)還從制造層面帶來(lái)了新武器——光刻計(jì)算庫(kù)NVIDIA cuLitho,一套可以集成在NVIDIA Hopper架構(gòu)中的光刻庫(kù)。
NVIDIA Hopper是去年GTC上英偉達(dá)帶來(lái)的全新GPU架構(gòu),并基于該架構(gòu)推出了首個(gè)產(chǎn)品英偉達(dá)H100。該產(chǎn)品已經(jīng)在短短一年時(shí)間里成為各大科技訓(xùn)練人工智能模型使用最多的GPU之一。
NVIDIA cuLitho可以通過(guò)計(jì)算技術(shù)大幅優(yōu)化芯片制造流程,利用GPU技術(shù)實(shí)現(xiàn)計(jì)算光刻,可以使傳統(tǒng)光刻技術(shù)提速40倍以上,為2nm及更先進(jìn)芯片的生產(chǎn)提供助力,幫助GPU提高在芯片制造場(chǎng)景中的工作效率。
黃仁勛在演講中透露,英偉達(dá)目前已經(jīng)和AMSL、臺(tái)積電以及新思科技建立了合作關(guān)系,ASML計(jì)劃將搭載了NVIDIA cuLitho軟件庫(kù)的NVIDIA Hopper GPU集成在他們所生產(chǎn)的光刻機(jī)設(shè)備中去。
“使用NVIDIA cuLitho軟件庫(kù)加上NVIDIA Hopper GPU替代目前光刻機(jī)上使用的CPU,整體的效率可以提升40倍左右,減少目前每年消耗數(shù)百億CPU小時(shí)的大量計(jì)算工作負(fù)載?!?黃仁勛介紹道,“臺(tái)積電可以通過(guò)在500個(gè)DGX H100系統(tǒng)上使用cuLitho加速,將功率從35MW降至5MW,替代用于計(jì)算光刻的40000臺(tái)CPU服務(wù)器。”
3
—
云上英偉達(dá)
最后我們?cè)俚奖敬蜧TC的另一個(gè)重頭戲——云上看一看。
英偉達(dá)這次帶來(lái)了一項(xiàng)名為DGX Cloud的AI超級(jí)計(jì)算服務(wù),搭配NVIDIA AI軟件,就能讓企業(yè)可以通過(guò)一個(gè)Web瀏覽器就能訪問(wèn)AI超算,消除了獲取、部署和管理本地基礎(chǔ)設(shè)施的復(fù)雜性,以便企業(yè)為生成式AI和其他開(kāi)創(chuàng)性應(yīng)用,訓(xùn)練先進(jìn)的模型。
目前,該服務(wù)已與微軟Azure、谷歌OCP、Oracle OCI合作,用戶可以租用DGX Cloud的月租為36999美元起。
除了算力,通過(guò)云服務(wù),英偉達(dá)還開(kāi)發(fā)了一系列的應(yīng)用模型,這些模型為特定領(lǐng)域的任務(wù)創(chuàng)建,通過(guò)專有的數(shù)據(jù)進(jìn)行訓(xùn)練,旨在把大模型創(chuàng)造的能力交給更多用戶。基于此,英偉達(dá)宣布NVIDIA AI Foundations模型,涵蓋NVIDIA NeMo語(yǔ)言模型、視覺(jué)模型Picasso和生物學(xué)模型BIONEMO。
NeMo是文本生成模型構(gòu)建服務(wù),能提供80億、430億、5300億參數(shù)的模型,并定期更新額外的訓(xùn)練數(shù)據(jù),幫助企業(yè)為客服、企業(yè)搜索、聊天機(jī)器人、市場(chǎng)情報(bào)等生成式AI應(yīng)用進(jìn)行模型定制。
Picasso是視覺(jué)語(yǔ)言模型構(gòu)建服務(wù),具有先進(jìn)的文生圖、文本轉(zhuǎn)視頻、文本轉(zhuǎn)3D功能,可為產(chǎn)品設(shè)計(jì)、數(shù)字孿生、角色創(chuàng)建等使用自然文本提示的應(yīng)用快速創(chuàng)建和定制視覺(jué)內(nèi)容。目前英偉達(dá)已經(jīng)與Shutterstock合作,開(kāi)發(fā)了Edify-3D生成式AI模型。
BioNeMo為生命科學(xué)服務(wù),提供AI模型訓(xùn)練和推理,加速藥物研發(fā)中最耗時(shí)和成本最高的階段,可加速新蛋白質(zhì)和治療方法的創(chuàng)建以及基因組學(xué)、化學(xué)、生物學(xué)和分子動(dòng)力學(xué)研究。英偉達(dá)與三菱聯(lián)合發(fā)布了將用于加速藥物研發(fā)的日本第一臺(tái)生成式AI超級(jí)計(jì)算機(jī)Tokyo-1。通過(guò)在Tokyo-1上使用BioNeMo軟件,研究人員能運(yùn)行高達(dá)數(shù)十億參數(shù)的先進(jìn)AI模型,包括蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、小分子生成、姿態(tài)估計(jì)等。
4
—
AI的“iPhone時(shí)刻”
過(guò)去短短幾個(gè)月,從ChatGPT推出、GPT-4發(fā)布、百度文心一言跟進(jìn)發(fā)布到微軟發(fā)布AI助手Microsoft 365 Copilot、Midjourney發(fā)布能“畫(huà)手指”的V5版本……AI技術(shù)刮起了一陣陣旋風(fēng),這些風(fēng)不僅吹到了行業(yè)里,更影響到了每一個(gè)普通人。
AI的“iPhone時(shí)刻”,此言不虛。
在這個(gè)AI時(shí)刻,自動(dòng)駕駛,甚至是整個(gè)汽車行業(yè)都顯得有些暗淡。
在黃仁勛一個(gè)多小時(shí)的演講中,汽車領(lǐng)域只在談及Omniverse時(shí)有所提及。據(jù)黃仁勛介紹,這個(gè)虛擬世界仿真引擎不是一種工具,而是一個(gè)USD網(wǎng)絡(luò)和共享數(shù)據(jù)庫(kù),也是與各行各業(yè)使用的設(shè)計(jì)工具相連接的基礎(chǔ)結(jié)構(gòu)。其一大用處是讓企業(yè)在實(shí)際建設(shè)工廠、生產(chǎn)產(chǎn)品前,通過(guò)數(shù)字化模擬“預(yù)覽”實(shí)際的成品。
奔馳、沃爾沃、豐田、Lotus等多家車企已經(jīng)在使用Omniverse構(gòu)建自己工廠的數(shù)字孿生、為新車型構(gòu)建、優(yōu)化和規(guī)劃組裝流水等。
這也讓筆者想起此前與國(guó)內(nèi)某3D引擎企業(yè)交流時(shí),對(duì)方談到,相比Unity、Unreal,英偉達(dá)才是那個(gè)真正可怕的對(duì)手。
確實(shí),別人引以為傲的單點(diǎn)能力,在英偉達(dá)這里,只是其以AI為核心構(gòu)建的技術(shù)產(chǎn)品帝國(guó)中的一環(huán)。
以點(diǎn)擊面,難度何其大。
曾經(jīng)的PC時(shí)代,英偉達(dá)只是配角,移動(dòng)時(shí)代也黯然離場(chǎng)。如今,AI大風(fēng)刮來(lái),英偉達(dá)也終于成為了人工智能這場(chǎng)新時(shí)代大戲的主角。
大風(fēng)愈刮愈烈,能把英偉達(dá)送到多高,我們且一起看看。同時(shí),我們也期待著,這場(chǎng)大戲中能出現(xiàn)更多動(dòng)人的角色與劇情。
來(lái)源:第一電動(dòng)網(wǎng)
作者:智車星球
本文地址:http://www.155ck.com/kol/198092
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。