流量至上、追星現場,這兩個詞應該是大多數人在今年北京車展上的第一感受。
車企的宣發重點,從技術分享和戰略展望轉向了車型介紹,甚至不少車企在車展現場直接安排上了帶貨主播。
媒體的關注重點,也跟著車企的節奏轉移,來到了自帶流量的雷軍和周鴻祎身上。
然而這場「流量盛宴」的背后,暗藏了價格戰下車企對于銷量的焦慮——一邊是友商瘋狂降價,一邊是智駕技術不斷迭代,降價提質的雙重壓力之下,能帶動銷量的流量成了車企的救命稻草。
如果走出會展中心的 8 個主要展館,來到周邊供應商的展臺,對這份焦慮的感知會更加明顯。
畢竟車企在智駕領域降價提質的壓力,最終還是會傳導到供應商身上。
車企忙著展示車、銷售車,智駕產業鏈上的供應商則在技術上鉆起了牛角尖。
從英偉達、騰訊云、元戎啟行、安霸科技等多家供應商的描繪中,逐漸拼湊出 2024 年智駕技術的發展藍圖——除了降本這個避不開的話題以外,各家談到最多的關鍵詞就是大模型和端到端,以及衍生出的算力不足恐懼癥、數據饑渴、無高精地圖、前融合與規則算法。
大模型標志著 AI 定義汽車觀念的形成,給行業帶來了算力不足恐懼癥,以及數據饑渴。
端到端大模型則意味著行業進入了 AI 定義汽車的 2.0 時代,無高精地圖、前融合與強大的規則算法能力是實現端到端的技術關鍵。
01、大模型時代:算力不足恐懼癥和數據饑渴
「好像現在不提大模型,大家都不知道怎么問問題了?!?/span>
在接連回答了十幾個問題之后,騰訊智慧出行副總裁劉澍泉發出了如上的感慨,這也是大多數智駕產業鏈上的供應商都會遇到的問題——不管你是做芯片的,還是做智駕方案的。
大模型之所以成為關注重點,在于其重塑了自動駕駛的技術路線。
英偉達全球副總裁吳新宙認為,自動駕駛是三段式的發展:
第一階段的自動駕駛系統完全基于規則,有著大量人工 Engineer Feature(工程師特征),目前已經過時。
第二階段的自動駕駛方案是規則算法與 AI(大模型)相結合,目前感知部分幾乎全部交給了模型,預測和規劃部分則是人工規則和 AI 模型結合,屬于目前的主流方案,也是 AI 定義汽車(智駕)的 1.0 時代。
第三階段的自動駕駛方案就是端到端大模型的方式,目前特斯拉的 FSD 就是基于此方案打造的,屬于 AI 定義汽車(智駕)的 2.0 時代。
自從大模型被引入自動駕駛之后,汽車自動駕駛的開發流程也發生了變化。
在軟件定義汽車時代,工程師要先寫好智駕系統的規則代碼,隨后進行大量路測收集問題,再針對性的修改智駕代碼。
而到了 AI 定義汽車時代,智駕開發分成了云端和車端兩部分。云端負責模型訓練和仿真驗證,隨后將云端成熟的智駕模型通過 OTA 部署到車端,再通過車端回傳的數據加強云端模型的訓練。
大模型的出現,無疑提升了智駕系統的能力上限,并加快了開發、迭代流程,但是也給車企帶來了新的問題——算力不足恐懼癥和數據饑渴。
想在云端訓練出優秀的大模型,對算力的需求非常高。
早在去年,特斯拉便砸錢 3 億美元購買了 1 萬塊英偉達 H100 芯片,將云端算力堆到了 10 EFLOPS,而在 4 月份的 Q1 財報上,特斯拉公布已投入使用了 3.5 萬臺英偉達 H100,并計劃在年底增加至 8.5 萬臺。
國內智駕第一梯隊的華為,云端算力也從去年 12 月的 2.8 EFLOPS 增加至 3 月的 3.3 EFLOPS,4 月份又更新至 3.5 EFLOPS。
在堆云端算力這件事上,車企只有三個選擇:
和特斯拉的 Dojo 一樣從零做起,自研高算力芯片。雖然成功后收益很高,但要面臨技術和資金雙重壓力,目前特斯拉 Dojo 超算中心的進度同樣不明朗,屬于高風險高收益的方式。
購買英偉達的芯片自建超算中心,雖然比第一種方式簡單了不少,但是自建云端超算中心的難度依舊不亞于造車。
與國內現有的云服務商合作,共建云端超算中心。
綜合來看,第三種方式是目前國內車企的共同選擇。問界、極越、蔚小理等分別選擇了華為云、百度云、阿里云、火山引擎和騰訊云等合作伙伴,云端算力正成為智駕開發的數字基建。
卷完了云端算力之后,車端算力成了第二戰場。
「做好自動駕駛的第一步是重建事件,重建的事件越真實、越一對一、越穩定、距離越遠,智駕的基本功也就越扎實」,元戎啟行 CEO 周光在采 訪中表示,「如果智駕連重建事件都做不好,又何談后面的理解、交互呢?」
而完美的重建事件,則非??简瀭鞲衅?、感知算法和車端算力之間的綜合能力。
傳感器越多、精度越高,收集的信息便越多,構建事件也就越容易,但是相應的對車端算力的要求也越高。
在目前智駕白熱化的競爭階段,通過優化算法減少對傳感器數量的依賴「太慢」,先加大算力跟上節奏顯然更「劃算」。
為了應對車端算力日增的需求,芯片廠商紛紛推出了更高算力的車端芯片。
英偉達推出了單顆芯片算力超過 1000TOPS 的 Thor,安霸科技也推出了 750TOPS 算力的 CV3-AD685 芯片,為車企后續更高的算力需求提供保障。
不過在車端芯片上,算力高不是唯一標準,還必須要考慮架構。
安霸科技中國區總經理馮羽濤告訴汽車之心,智駕芯片雖然是底層硬件,但是開發過程非常強調「算法優先」——比如 Transformer 架構出現后,很多芯片由于沒有提前適配所以沒辦法運行,要想跟上需求的發展,就必須更加關注前沿算法。
安霸科技總裁兼首席執行官王奉民補充了一個有趣的案例:
安霸科技在 2018 年時,發現特斯拉的報告中提到了正在研究新一代的算法,雖然沒提到具體的架構,但是安霸科技從描述中推斷特斯拉要用到的算法應該是 2017 年提出的 Transformer,便開始針對該算法進行芯片開發,最終在 2018 年推出了支持 transformer 的 CV2 系列芯片。
當然,這次豪賭背后同樣存在風險——安霸的智駕芯片流片一次的成本大概在 2000 萬美元,所以芯片廠商不僅要關注前沿算法,還要能判斷算法的發展趨勢。
供應商們解決了車企的算力不足恐懼癥后,還要繼續滿足車企的數據饑渴。
元戎啟行 CEO 周光多次強調,要想做好大模型、尤其是端到端大模型的自動駕駛,就必須要有大量數據,沒有量產數據支撐就是死路一條。
供應商雖然無法為車企提供量產數據,但是可以用大模型的方式,提供「平替」數據。
英偉達和騰訊均強調了基于生成式 AI 的「仿真」環節。通過生成式 AI,車企可以生成海量仿真數據用來訓練云端大模型。
雖然和真實數據相比,AI 仿真訓練還存在置信度和覆蓋度等方面的問題,但是對于本就缺乏真實數據的車企而言,生成式 AI 不僅讓訓練大模型成為可能,還能加快智駕系統的開發流程。
訓練后的模型在 OTA 部署到車端之前,可以先在仿真環境中進行測試和驗證,更快更高效地排查問題。
解決了算力和數據的問題,車企才算邁入 AI 定義智駕的 1.0 時代。
02、端到端大模型:無圖、前融合、規則算法缺一不可
從 AI 定義智駕的 1.0 時代進入 2.0 時代,核心是實現端到端的智駕大模型。
而要做到端到端,就面臨著三個門檻:
無高精地圖、前融合,以及強大的規則算法做支持。
首先是業內喊了一年多的去高精地圖,關注重點普遍集中在覆蓋面積、采集成本和地圖鮮度上,但是即使解決了上述問題,不去掉高精地圖依舊無法實現端到端。
在這一點上,英偉達和元戎啟行表達了相似的觀點——真正的端到端大模型是擬人的,擅長邏輯推理而非計算。
目前的高精地圖,本質上還是給機器看的地圖,用的是機器語言。而端到端大模型的思考方式更類似于人腦,在處理機器語言的能力上非常薄弱,看不懂高精地圖。
端到端智駕大模型需要的地圖,是人類也能看的懂的導航地圖。
元戎啟行推出的端到端智駕平臺 IO,使用的就是騰訊提供的導航級地圖。最近傳聞即將在華落地的特斯拉 FSD,也被曝出將在百度提供的車道級導航地圖上進行部署。
端到端落地的第二個前提,是多傳感器信息必須要做前融合。
在以往的智駕方案中,各個傳感器中收集到的信息會先用人工規則篩選一遍,再將人類認為有用的信息進行融合,最后交由智駕系統使用。
但是端到端大模型和大腦一樣,對于人類程序員來說像一個「黑盒」,如果還是按照人工規則先篩一邊傳感器的信息,無疑會遺漏掉很多對于端到端大模型有用的信息。
而先融合的方式,能在成本不變甚至減少的情況下,大幅提升傳感器信息的準確性。
基于該理念,安霸做了一款基于 CV3 中央域控的 4D 成像雷達,在毫米波雷達上不放任何處理芯片,將雷達收集到的信息全部傳回中央域控,由高算力的中央域控融合處理多個傳感器的信息——通過這種方式,可以大幅提高毫米波雷達的感知能力。
想要做好端到端智駕方案的第三個條件,是車企具備強大的基于規則算法的智駕方案。
雖然端到端智駕大模型成功的標志,就是盡量減少人工編寫的規則算法,但是對于端到端智駕系統而言,則離不開上一代基于人工規則的智駕算法。
元戎啟行和安霸都提到,目前特斯拉的智駕系統后臺同時運行著 V11(規則算法)和 V12(端到端大模型)兩套方案,在不同的路況下會切換使用。
兩套方案并行的原因主要有二:
第一點,是兩套方案的能力互補。
貼近人腦的端到端大模型,具備更強的推理能力和博弈能力——比如遇到突發情況時,規則算法只會根據規則死板執行命令,而端到端則可以根據理解靈活操作。
基于人工代碼的規則算法,在計算能力上更具優勢——比如在泊車時,規則算法可以通過精確的計算,選擇最完美的倒車入庫路徑,而端到端則會像人一樣邊開邊調整,不斷揉庫。
第二點,是目前的端到端大模型才剛剛起步,需要不斷學習。
吳新宙用了一個很形象的比喻來描述端到端大模型和上一代規則算法的關系,端到端大模型天賦更高,未來可以成為博士,但是在成長的過程中,也需要小學老師、初中老師去教導,而這些老師,就是規則算法。
吳新宙和周光也給出了共同的預判:
目前的端到端大模型處于起步階段,還需要不斷成長才能趨于完美,因此在未來幾年,端到端大模型和規則算法兩套方案相輔相成應該是大勢所趨。
AI 定義智駕 1.0 時代對算力和數據等硬實力的需求,或許可以通過供應商提供的數字基建來解決。
但是想邁入 AI 定義智駕 2.0 時代,如何去高精地圖、如何做好前融合,有沒有強大的規則算法能力,則是對車企和智駕供應商軟實力的考驗。
03、大模型不是終點,只是 AI 時代的開端
在和多家智駕產業鏈供應商交流之后,還有兩個不那么「技術」的感受。
第一個感受,是端到端大模型并不會是 AI 定義汽車的終點,而只是個起點。
元戎啟行的分享中提到,端到端大模型雖然在推理能力上和人類非常類似,但是某些情況下的學習能力依舊不足。
比如在復雜的路口時,人和端到端大模型都可能會走錯路,但是人再一次繞回這個路口時,能立即排除一個錯誤選項,而端到端大模型不行,大模型要學會一個東西,可能要在云端經過成千上萬次的訓練。
要想提高端到端大模型的表現,還有很長的路要走。
第二個感受,是業內也在探索大模型在汽車行業的更多應用場景。
英偉達汽車行業數據中心業務副總裁 Norm Marks 分享了六大類英偉達正在應用大語言模型的場景,涉及智駕、智艙、數字工廠、開發設計等多個領域。
除了英偉達以外,安霸也進行了類似的探索,推出了生成式 AI 芯片 N1,算力水平達到了英偉達 A100 的 70%,但功耗僅有 A100 的 10%,50 瓦的功耗讓車端運行大模型成為了可能。
目前車端搭載的普遍為云端大模型,存在隱私和穩定性兩方面的缺點,因此只能用于娛樂、對話等功能。
而當通用大模型部署到車端本地之后,就可以參與一些更重要的工作中去,比如幫助智駕大模型做一些判斷等。
這種在應用場景上的探索與迷茫,一定程度上說明目前 AI 的技術發展速度已經超過了實際應用場景,存在著一定的「泡沫」。
但是反過來看,當技術超前到一定程度之后,必然會從底層重塑整個汽車行業。就像 2001 年互聯網泡沫破裂之后,互聯網反而重塑了整個人類社會的生產方式。
目前端到端大模型在汽車上的應用,必然只是 AI 定義汽車時代的開始。
來源:第一電動網
作者:汽車之心
本文地址:http://www.155ck.com/kol/229578
文中圖片源自互聯網,如有侵權請聯系admin#d1ev.com(#替換成@)刪除。