本周,全球智能駕駛領(lǐng)域有兩個大新聞:特斯拉發(fā)布 FSD V13、Waymo 正式進入洛杉磯市區(qū)。
兩件事我們都會寫,大家可以持續(xù)關(guān)注「前沿」欄目,這是「硬核時間」欄目的新名字,今天先來看特斯拉。
2024 年,端到端是中國新造車智駕領(lǐng)域繞不過去的名詞,不開一場跟端到端有關(guān)的發(fā)布會,似乎無法進入智駕第一梯隊的競爭語境中。
脫胎自 ICT 通信領(lǐng)域的科技術(shù)語,之所以會成為中國新造車智駕傳播的風暴眼,原因很大一部分,要追溯到 2023 年 5 月 8 日馬斯克的推特:
「FSD is end-to-end AI, from images in to steering, brakes & acceleration out.(FSD 是端到端 AI,輸入圖像,輸出轉(zhuǎn)向/制動/加速信號)。」
18 個月后,F(xiàn)SD 從 V11 迭代到 V13,這也是第一個專為特斯拉 HW4 硬件做優(yōu)化和重構(gòu)的 FSD 版本。
很有意思的,是特斯拉直到 V13,才完全稱其為「Start from park(從車位啟動)」,和國內(nèi)宣傳的「車位到車位」相比,似乎已經(jīng)被追上了?
但是,根據(jù)最近幾天早鳥用戶對 FSD V13 的實測,我們發(fā)現(xiàn),相比國內(nèi)新造車,也許特斯拉才算得上是徹底的「端到端」量產(chǎn)者。
今天直接從車位開始聊。
真·端到端
我們已經(jīng)測試過幾家新造車的「車位到車位」,目前來看體驗都相對順暢,場景之間流轉(zhuǎn)相對絲滑,拼接感也沒有那么重了。
等等,什么是「拼接感」?
想要聊清楚這個話題,我們要先回憶一下,一次普通出行如何開始?如何結(jié)束?
如果在車庫里,那么掛 D 檔就能走;如果要回正常車庫,那么到固定位置倒車入庫,或者找到可用車位倒車入庫就行。如果是從側(cè)方車位出發(fā),那么就得根據(jù)實際情況,可能要先掛 R 擋找到空間,再切 D 檔位,反之同理。
而目前國內(nèi)新造車的「車位到車位」,在泊入泊出環(huán)節(jié)依然依賴「記憶泊車」功能,也就是需要駕駛員建圖,出入也會參考駕駛員的已有路徑。
當然,像是華為乾崑 ADS 和理想雙系統(tǒng)智駕,它們的記憶泊車類功能已經(jīng)優(yōu)化得相對到位,我們實際測試過程中,并沒有很明顯的切換痕跡,如果你的停車位固定,那么體驗不會有明顯斷層。
而這也是 FSD V13 驚艷的,或者說「第一性原理」再次發(fā)力的地方:它可以從任意停車位自主啟動,可以自主掛倒擋。
這意味著 V13 并不需要專門的「建圖」環(huán)節(jié),或者說它的功能邏輯完全就是人類開車出行的邏輯:看情況出發(fā),看情況停車,核心在于「看情況」。
比如 YouTube 博主 Whole Mars Catalog,他兩天前發(fā)布的第一批 V13 體驗視頻中可以很清晰看到,F(xiàn)SD 啟動后可以從無標線側(cè)方臨停車位中,自動倒擋找空間出發(fā)。
再比如 YouTube 博主 Dirty Tesla 測試的,車頭對內(nèi)泊入的露天停車場,F(xiàn)SD 同樣是自主倒擋出來,絲滑上路:
又比如下面,他還測試了中國觀眾更熟悉的場景——多層停車場。
泊入之前 FSD 其實走了指示牌的反方向,默認制造了困難。
但最終 FSD 在泊出到離開停車場的過程中,依然根據(jù)車庫中高懸的「EXIT」和箭頭標識,選擇了正確的路線,全程零建圖痕跡。
這也是我們強調(diào) FSD V13 更應(yīng)該是「真·端到端」的原因:無拼接、無切換、直接而類人的功能體驗。
需要強調(diào)的是,「真端到端」和「優(yōu)秀體驗」之間,目前并不劃等號,比如下圖,F(xiàn)SD 怒闖一個左轉(zhuǎn)紅燈:
?但在端到端的語境中,F(xiàn)SD V13 目前表現(xiàn)出來的能力,和國內(nèi)新造車相比,明顯更符合全程「圖像輸入,方向盤輸出」的前提。
特斯拉的「AI 4.0」時代
去年這個時候,中國新造車的傳播熱詞是「全國都能開」。這個詞后來衍生出很多變種,「全國都好開」、「全國自己開」,等等。
也是去年底,F(xiàn)SD V12 逐漸浮出水面。
V12.1,是特斯拉向 Early Acess 用戶推送的第一個 V12 細分版本。更新日志寫得很簡潔,但代表著一場全新的競賽拉開序幕:
「FSD Beta V12 將城區(qū)駕駛堆棧升級為基于數(shù)百萬個視頻片段訓練的單個端到端神經(jīng)網(wǎng)絡(luò),從而取代了超過 30 萬行顯性 C++ 代碼。」
特斯拉很少提起端到端,但每一次放在更新日志里面,都代表著重大升級。比如 FSD V12.5 里面,特斯拉正式統(tǒng)一了高速和城區(qū)兩個技術(shù)棧的端到端模型。
這意味著比起「場景拼接」,「場景延伸」更符合特斯拉的智駕邏輯——體驗不能算很好,但每一個觸達的場景,都是真正的端到端。
我們可以回過頭看 FSD V12.1 的體驗視頻,當時 FSD 還做不到從任意一個車位倒擋啟動找空間,但已經(jīng)可以實現(xiàn) Autohold 狀態(tài)下啟動,自主掛 D 檔出發(fā),然后在終點附近靠邊臨停。
從 12 到 13,雖然只是倒車的一小步,卻是特斯拉 AI 架構(gòu)的一大步。
來回顧下 FSD V13 的官方更新日志,可以說就差把「硬件 4.0(AI4)專屬」寫在第一句了:「全分辨率 36HZ 的 AI4 視頻輸入、原生的 AI4 輸入和神經(jīng)網(wǎng)絡(luò)架構(gòu)」。
其實更新日志里還有一句「支持音頻輸入(大模型)」也很有意思,但那足以另起一篇文章,我會填坑的。
特斯拉 AI4 由 8 個 500 萬像素攝像頭組成感知硬件系統(tǒng),內(nèi)部算力大概是 720TOPS(業(yè)內(nèi)估算),為 HW3 的 5 倍,視覺感知能力(像素數(shù))則達到了 HW3 的 4 倍左右。
V12 時期,特斯拉實際上是用 AI4 跑針對 HW3 訓練的模型,這意味著AI4 的潛力遠未發(fā)掘到極致。
而伴隨 V13 的推出,特斯拉才正式進入 AI4 時代。
自從 2021 年 AI Day 之后,特斯拉甚少公布底層技術(shù)邏輯的演進,但我們可以從一些蛛絲馬跡中,大概窺探馬斯克如何實現(xiàn)自動駕駛。
舉個例子,V12 更新日志里面強調(diào)了兩個方向:增加用以訓練的視頻片段,也就是 clips;減少規(guī)則向的冗雜代碼。
無獨有偶,V13 正式推送之后,特斯拉AI部門高級工程師 Yun Ta Tsai 表示,「V13 看上去很像猛禽 V3 火箭發(fā)動機,非常干凈」。
再往前看一點,Issac 的《馬斯克傳》中提到,2023 年初,特斯拉已經(jīng)訓練了 1000 萬個用戶上傳的 clips,距離 V13 已經(jīng)過去接近兩年,這中間特斯拉賣出接近 360 萬臺車。
如果在國內(nèi)尋找類似的表達,理想汽車目前推送的 OTA 6.5 顯示「基于 500 萬訓練 clips」,官方表示年底會達到 1000 萬 clips;而小鵬汽車目前的進度是「模型訓練數(shù)據(jù)量已達到 2000 萬 clips」。
有意思的是,和訓練數(shù)據(jù)、訓練算力的先發(fā)先行相比,特斯拉的車端硬件能力,向來不追求「參數(shù)領(lǐng)先」,即使面對著近在咫尺而刺刀見紅的自動駕駛黎明時刻。
「永遠不要用導(dǎo)彈打蒼蠅,用蒼蠅拍打」,馬斯克本人的話也許能解釋這種現(xiàn)象。
2025 見分曉?
V12 發(fā)布的時候,我當時寫了一篇這樣的稿子:《看完FSD V12.3的視頻,我發(fā)現(xiàn)這才叫「全國都能開」?》
標題很像,因為現(xiàn)象基本一樣。
年初我們還在爭論什么才算「全國都能開」,年底則進展到更全面、長尾、細致的「車位到車位」。
也許是競爭土壤過于貧乏,特斯拉在北美不會用詞匯包裝功能,想看每個版本能干嘛的話,更新日志自己理解就行。
但從實測視頻我們能看到,F(xiàn)SD 始終是端到端 AI 的堅決執(zhí)行者,甚至在看似沒有天敵的美國,進展依然比中國新造車更果決迅速。
不過,AI4 主導(dǎo)的 FSD V13,對應(yīng)著特斯拉智駕登陸全球的新階段。
國內(nèi)討論起 FSD,除了對 tech vision 的贊嘆,更多的其實是對路況、路權(quán)、法規(guī)不同的疑問。大家都在期待 FSD 入華一較高下的時刻。
到底是新造車如雷貫耳的「車位到車位」更勝一籌,還是特斯拉悶聲趕路已達終點?
翻過這一年,我們會有新答案。
(完)
來源:第一電動網(wǎng)
作者:電動星球News蟹老板
本文地址:http://www.155ck.com/kol/256334
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。