DeepSeek 往 AI 行業丟擲了一枚重磅炸彈。
低成本、低算力,做出了媲美 Chatgpt 的高性能模型。這項革新的直接影響者是英偉達,市值一度蒸發超 3000 億美元。
這也使得關于「算力過剩」的討論再度被拎上臺面。
實際上,DeepSeek 的案例揭示了 AI 行業隱藏在算力神話下,更具含金量的東西,比如算法模型、芯片性能以及性價比。
它揭示了一個基本事實,算力只是關乎模型訓練的有力條件,但不是充要條件。
今天留在牌桌上的芯片企業,英偉達、地平線、黑芝麻、華為、Mobileye 已經注意到了這點,從它們最新動作中可見,算力只是握在手中的籌碼之一,且態度各異。
包括一度用算力標榜自身的英偉達,在當下也感到了不小危機感。
市場對于芯片企業的要求一直是做到未雨綢繆,現在它們都朝著軟硬一體的大方向強化競爭壁壘,這其中,性價比才是重點,擴大生態圈才是核心。
01、算力斗獸場,上演「紅與黑」
2022 年,英偉達發布了一顆算力猛獸——Drive Thor,AI 算力最高達到 2000TOPS,是上一代 Orin X(256TOPS)的 8 倍。
在業界還習慣于用 100TOPS 作為中、高算力的分水嶺時,Thor 無疑來到了夸張級別。
但本應在 2024 年中量產的 Thor 陷入難產,最新消息是,Thor 的算力被修改為 1000TOPS,今年中將先提供 730TOPS 的低算力版本芯片。
把算力拉滿,Thor 的確值得期待。
極氪、理想、小鵬、比亞迪、沃爾沃、豐田等車企,以及元戎啟行、卓馭科技等供應商,早早就下了量產訂單。
根本原因為,行業新技術對于算力的需求值漲到了千 TOPS 級別。
顯著代表是「VLA」——視覺語言動作模型,被元戎啟行、理想都視為開啟端到端 2.0 時代的鑰匙。但 VLA 需要處理大量視覺、語言等多模態數據,對于算力的需求更為苛刻。
目前,理想單「端到端+VLM」雙系統模型,就需要消耗兩顆 Orin-X 芯片,即 508TOPS 算力。
有行業人士認為,如果要部署「端到端+VLA」模型,Orin-X 顯然不夠,Thor 可能成為了必選項。
英偉達的 Thor 撕開了市場對于芯片超高性能的需求裂口,揭開整個算力市場「紅與黑」的兩面性。
紅指激進。
在大算力緯度上,Thor 已經有了對手。
黑芝麻 2024 年 12 月底發布的華山 A2000 系列。
上一代 A1000 系列中的旗艦款,A1000Pro 的 AI 算力還是 106TOPS。
而新發布的 A2000Pro 盡管未直接標明算力大小,但從「4 倍行業旗艦芯片」的性能注解,可以預估至少有幾百 TOPS,如果行業旗艦芯片指 Orin-X,那么 A2000Pro 的算力將來到 1000TOPS,與 Thor 不相上下。
地平線則在 2024 年 4 月推出征程 6 系列,覆蓋低中高階智駕,其中旗艦款產品征程 6P 的 AI 算力一度被拉到 560TOPS,幾乎是征程 5(128TOPS)的 5 倍,Orin-x 的兩倍。
據地平線介紹,征程 6P 采用「神經網絡+規則引擎」的混合架構,支持端到端大模型,以及時下流行的 VLM、VLA 等技術路徑。
值得一提的是,地平線征程 6P 的 560TOPS 算力旁,還有一句注解:在 1/2 稀疏網絡下的等效算力。
它指的是征程 6P 在稀疏網絡下 AI 算力可以達到 560TOPS。
所謂稀疏網絡,是指網絡中的權重矩陣中有大量的零權重,即只有部分神經元與前一層的神經元相連。
它對應的是稠密網絡,指網絡中的每個神經元都與前一層的每個神經元相連,沒有零權重。
兩者呈現的算力數值代表意義不同,可以簡單理解為,稀疏算力指計算簡單題的能力,而稠密算力指計算復雜題的能力。
目前包括英偉達,大多數芯片的高 TOPS 背后,其實指代的只是稀疏算力,相比稠密算力,它在數值表現上往往會高出一倍。
在這種情況下,華為選擇強調稠密算力,由此引出了算力場「黑」的一面,即對算力保持克制態度。
華為昇騰 610 發布于 2020 年,算力 200TOPS,此后很長一段時間,華為暫未有發布新產品的正式動作。
原因有兩點。
一是晟騰 610 足夠能打,200TOPS 級別算力,已經是地平線 J5、黑芝麻 A1000Pro 的兩倍,毫無疑問是算力王者。
更何況,200TOPS 是稠密算力,這意味著該芯片在處理智駕這類復雜計算任務時,效率更高,性能表現更好。
二是華為作為 Tier1 的身份,使其芯片可以在軟硬一體的優勢下,與算法協同發揮出更強大效能。
由此,伴隨著華為乾崑 ADS 方案,昇騰 610 一直在市場吃香,據蓋世汽車研究院數據顯示,2024 年前 8 個月,華為昇騰 610 憑借 10.3% 的市占率在國內智駕域控芯片市場排名第三。
目前,華為對于昇騰 610 的預期已經提升至 L3 級,比如昊鉑 GT 智駕版就搭載了昇騰 610,目前其同款硬件車型已經拿下了 L3 級的上路牌照。
如果說華為對于算力的克制是因為是提前沖刺,并且準備充分,Mobileye 就是一直小步慢跑,算力一點點往上加。
2022 年,Mobileye 發布的 EyeQ 6 系列芯片,AI 算力雖然是 EyeQ 5 的兩倍,也僅為 34TOPS。
但 Mobileye 一直自信認為,EyeQ 6 High 的支持上限并不低,比如基于復合人工智能系統,搭載了 2 顆 EyeQ 6 High 的 SuperVision 方案能夠達到可脫手的智駕能力。
而下一站的 EyeQ 7 系列,算力也僅是在 EyeQ 6 High 上繼續翻倍,AI 算力僅為 67TOPS,不過制程突破到了 5nm,預計 2025 年中提供樣品,在 2027 年開始量產。
與華為一樣,Mobileye 的芯片與方案往往打包出售,并且,它認為大算力并不能決定一切。
Mobileye 認為 FPS 才是算力更貼切的指標,相比 TOPS 只計算每秒運算次數,FPS 計算每秒幀數的方式,更能直觀體現該芯片在處理智駕圖像、視頻數據的能力。
比如 EyeQ6 High 每秒可以處理超過 1000 幀像素標記神經網絡,相比 EyeQ5 的每秒 91 幀,效率提高了超十倍。
這意味著,EyeQ6 High 能夠以高幀率完成圖像數據處理,在感知、決策端擁有更好表現。
從理性主義出發,Mobileye 已經歸納出一條低成本、高性能抵達全無人駕駛的路徑。盡管算力還未超過 100TOPS,但依托于對算法與規則的融合處理,它堅信這是一條可行的方法論。
02、軟硬一體,性價比才是好生意
正如 Mobileye 所言,算力僅是芯片的核心評判維度之一。
今天關于芯片的終極討論在于性能,芯片企業都瞄準了不同的價格帶,竭力思考如何把性能拉到最滿。
通過性價比超車,永遠是一個更切實的機會。
從目前各家芯片的特點中,其實能看到一些共性:
車規級芯片,獲得 ASIL-D 安全認證;
集合 CPU、GPU、MCU 等多類型計算單元,完成異構計算;
7nm 制程成為最低門檻。
而當共識成為同質化表現后,芯片企業還需要面向未來,注入其它維度的「加成」打造差異化性能。
這里存在兩個發力方向。
一是芯片都在圍繞高效,強調「原生適配 Transformer 架構」。
這點像是在異構計算的基礎上把力打透,Transformer 架構作為目前智駕行業公認的算法框架,芯片支持該模型,強調的是與主流算法適配,開發出高階端到端智駕方案的能力。
此前 Orin-X 就因不支持 Transformer 架構,推理時延長,被理想詬病過。
所以英偉達在 Thor 的產品簡介中,強調了其 CPU 采用了全新 Blackwell 架構,專為 Transformer 大模型和生成式 AI 功能設計的能力。
而地平線征程 6P 與黑芝麻 A2000Pro 也是在這點上「炫技」。
征程 6P 搭載了地平線自研的第三代 BPU 納什架構,這種架構的特點在于靈活計算,即能夠對 Transformer 算法中的各種細小操作進行高效處理,如目標檢測、軌跡預測、路徑規劃等。
它能確保在處理復雜運算任務時,提供足夠的精度與計算速度,同時三層存儲架構的設計也能優化帶寬。
黑芝麻 A2000Pro 同樣應用了其獨創的 NPU 架構——九韶,特點在于大核架構,解決了算力利用率低、延時高的問題,確保在面對復雜運算時能高效運行并輸出準確推理結果。
此外,芯片還集成了 Transformer 的硬加速模塊,可以提升該模型的算法運行效率,并同樣用三層內存架構降低了對外部存儲的依賴。
思路其實是一致的,相當于此前是培訓做題方法,現在是培訓專有題型,把智駕難題做得更得心應手了。
二是優化服務能力,提供完整的開發工具鏈。
芯片公司如今卷起了軟硬協同下的服務能力,這同樣是「性價比」的重要表現。
一方面是開放,為開發者提供更多的自主性與可操作性。
Mobileye 從 EyeQ5 開始也意識到這點,芯片開始可編程操作。從 EyeQ6 系列開始,它開始提供軟件開發工具包 EyeQ Kit,包含算法庫、驅動程序等,能使得開發者基于需求完成個性化設計。
今年 CES 上,MobileyeCEO Amnon Shashua 教授還直言,「我們允許客戶直接在芯片上托管第三方應用程序。」
當然,開放更是國內芯企的強項。
黑芝麻創始人單記章曾提到,黑芝麻芯片之上的每一層軟件都可以進行定制與替換,進而拓寬使用場景,實現大規模出貨。
這也來到開放的另一方面,提供更豐富、好用的開發工具。
比如,地平線、黑芝麻為了讓開發者快速上手最新芯片,孵化了一整套開發工具,覆蓋從標注、訓練到仿真等模型開發全流程。
前者打造了 BPU 工具鏈、天工開物平臺等。
后者則是構建了新一代 BaRT 工具鏈、雙芯粒互聯技術 BLink 等。
這些工具適配于 TensorFlow、PyTorch 等主流訓練框架,可以幫助開發者充分利用芯片強大潛力,擴展算力邊界,提高模型開發效率。
實際上,這些行為也在印證并加速軟硬協同的大趨勢。
黃仁勛一直把英偉達定位成軟件與系統整合的企業,認為旗下的軟件與硬件具備同等價值。
英偉達打造 Thor 能成為性能王者,離不開其在軟件平臺上的高速創新,這其中包括 CUDA 生態系統、Drive 軟件平臺、推理工具 TensorRT、數字孿生平臺 NVIDIA Omniverse 等穩定的開發工具。
今天的芯片公司,不僅在比拼在底部構筑地基的能力,也在較量往高處建設大廈的水平。
03、生態攻防戰,卡位下一個爆款
芯片企業已經告別了單純賣硬件的生意模式。
它們構建完整開發工具鏈背后,是一直反復強調的關鍵詞:生態。
比如英偉達,屹立不倒的重要原因之一,源于其早早就構建了一整套成熟的生態系統,讓客戶形成一定的技術依賴與轉換成本,產生粘性。
而國內的后起之秀地平線、黑芝麻也通過性價比策略接連完成了從 0 到 1 的生態建設過程,并敲響上市鐘聲。
而華為、Mobileye 在生態建設上具有先天優勢。
兩者作為智駕供應商,能夠通過出售軟硬一體的方案增加芯片出貨量。
華為的芯片,背靠鴻蒙智行、Hi 模式,享受著「朋友圈」不斷擴大的銷量紅利;
Mobileye 芯片則依靠早期品牌聲量積累,能夠吃到全球化市場的蛋糕。
現在,五家芯片企業在不同節奏下走到了分岔路口。
在如何進一步上量,擴大生態圈的命題面前,選擇了不同方向。
一是強調可擴展性,擴大生態橫截面。
英偉達打了個樣,Thor 的應用場景已經不止 L2、L3 階段,它能夠覆蓋智駕全場景,包括 L4 的 Robotaxi,已經 L5 全無人駕駛階段。
而黑芝麻也立刻跟上,其對于 A2000Pro 的定位是全場景通識智駕,簡單理解就是強調芯片對于駕駛場景的全面理解能力,包括城市道路、高速公路、晝夜變化及各類天氣條件下的不同場景。
這意味著,A2000Pro 同樣可以覆蓋從 L2-L5 的全場景智駕。
值得一提的是,黑芝麻智能 CMO 楊宇欣曾表示,A2000 將不止于智駕,還會面向具身智能等大模型應用場景去拓展。
他表示,機器人的產業鏈、生態的布局和結構跟汽車的重疊度非常高。
這指向了智駕芯片企業的另一條增長曲線。
二是深度強化軟硬一體,從 Tier2 向前大邁步。
隨著智駕開發周期越來越緊張,芯企需要靈活配合車企/方案商,滿足不同的市場需求。
若車企/供應商有自研能力,則提供靈活性開發工具進行適配;
若沒有模型開發經驗,則提供全棧軟件方案。
黑芝麻在 A2000 系列發布前不久推出了端到端算法參考方案,基于端到端架構,在決策單元引入了 VLM 視覺語言模型與 PRR 行車規則等,提升智駕系統決策規劃能力。
這相當于一個智駕 Demo,幫助車企/供應商快速上手軟件開發。
值得一提的是,地平線在戰略上選擇了 All in。
從縱向、橫向把市場全面吃透。
憑借 700 萬顆芯片出貨量成績,地平線已經牢牢穩住了國內低階、高階市場位置,分別僅次于 Mobileye 與英偉達。
而從征程 6 系列開始,地平線依然可以用「芯片全家桶」的形式,吃準低中高階智駕的新需求。
此外,地平線也在延展商業邊界,用征程 6P 打出了 SuperDrive 這張王牌,該方案目前已經在北京晚高峰、上海老城區等復雜場景中進行測試,做到了全程無接管,今年 8 月實現量產落地。
從芯片到完整方案,地平線重新定義了自我身份,將商業生態的天花板繼續抬高。
由此,一輪新的較量在芯片行業開始上演,在這個同樣研發投入巨大,靠高出貨量解渴的供應鏈上,各家都加緊擴建森林,打造良性循環的生態模式。
更殘酷的一點是,身處 AI 急劇變化的時代,一條游戲規則改寫就足以顛覆整個行業。
DeepSeek 已經敲響了警鐘,今天的芯片企業必須時刻緊繃著,它們不僅要煉出鋒利的武器攻擂,還要磨出堅固的盾牌守塔。
在攻防之間,芯片企業們,亟待下一個爆款出現。
來源:第一電動網
作者:汽車之心
本文地址:http://www.155ck.com/kol/261867
文中圖片源自互聯網,如有侵權請聯系admin#d1ev.com(#替換成@)刪除。