特斯拉 FSD Beta V12 的軟件代碼行數從 30 萬行縮減到 2000 行。
遠在北美的特斯拉車主們,陷入了一場驚奇、詫異、狂歡等各種情緒組成的渦流中。情緒的來源,則是和特斯拉近期的 FSD Beta V12 一系列推送有關:
在這一次的版本更新說明中,特斯拉提到,此前負責城區智駕的堆棧已經升級為單一的端到端神經網絡,而接近 30 萬行 C++ 代碼已經由經過數百萬個視頻片段的訓練替代。
這是特斯拉面向普通用戶的一次重磅更新,帶來的影響不止是 X 上涌現的各種“民間短視頻”,北美人們的熱情還刮到了微博、微信等中文互聯網社交平臺上……
當然,端到端(end-to-end)這個詞在本土市場上也不是第一次出現——事實上小米 SU7 已經宣布其為首個量產端到端記憶泊車的車型。
這很可能是 2024 年智能化領域最熱門的技術詞匯,或許也有可能是最熱門的營銷詞匯。但在此之前,端到端是什么、端到端能帶來什么、端到端會不會向 BEV+tranformer+OCC 那樣成為國內智駕內卷的新階段技術……諸多疑點,讓我們先行觀察,再嘗試解答一番。
在嘗試解讀端到端的原理之前,我想對于端到端最初始的思考,是有充分必要的溯源的。
我們日常所提及的高速智駕、城區智駕,在現階段,這兩項功能的實現原理,大致可以總結如下:
首先,由車外的傳感器采集路面信息數據,通過我們熟知的各種算法,如 BEV+Transformer+OCC ,本質上是將現實世界解構重繪,讓車內的智能駕駛控制域先行理解現實世界中可能存在的信息;
其次,控制域根據算法解析的世界,進行車輛行進路線的規劃;
最后,控制域發出指令,控制車輛的油門/剎車深度、方向盤轉向等行駛參數。
上述是對于現階段智能駕駛比較粗略的原理解析,我們在其中可以看到,控制域不能直接接收現實道路的原始數據信息,必須經由算法重繪、提取特征,才能進行后續的規控。就像是新生兒父母為寶寶打造營養輔食——小孩子(智駕控制域)不能直接消化原始的食材(現實世界信息)。
而上一段的陳述,顯然是為了端到端大模型的登場做準備:端到端大模型,從字面意思理解,便是直接學習/提取現實世界特征,無需對數據進行多次算法加工(即感知-規劃-控制),即可令智駕控制域輸出行車指令。
從理論角度分析,端到端大模型上車的優勢顯而易見——不同于現階段的智能駕駛需要進行流水線般在多個模塊運行處理得到最終結果,端到端就像是一個盒子,把數據丟進去,把指令生成出來,基于數據驅動的表現給人非常直觀的反饋。
但細心的朋友應該注意到了,我在提及端到端優點時,開頭是“從理論上”。
回歸到智能駕駛本質,其并不等同于自動駕駛,因此在過往、現在、甚至往后較長的一段時間里,我們都會處在“人機共駕”的狀態中——智能駕駛本質是將人類司機駕駛的邏輯用算法進行分割重繪,結合感知信息,讓智能駕駛盡量模擬人類司機的行駛軌跡。
問題也就出現在此:如果將人駕邏輯理解成一塊完整的面包,智駕必須將人駕這塊“面包”進行切割再消化,但刀法(算法)的不一,導致由于切割掉在地上的面包屑灑落或多或少。這部分沒能消化的面包屑,便是智能駕駛觸達的邊界,即需要人類司機接管的時刻,又稱 Corner Cases。
而端到端大模型,更像是直接將整塊“面包”進行囫圇吞棗的操作——特斯拉當然能輕易吞吐數百萬的“老司機式駕駛”視頻訓練片段,但如果進行全量開放后,純粹的端到端大模型極有可能吃到“發霉的面包”。
就像最開始的 ChatGPT 般,無論好壞的互聯網信息都會進行吞吐,輸出錯誤的暴論。
因此,在特斯拉并未對此次端到端神經網絡的更新做出更進一步說明時,外界也有部分猜測:特斯拉 FSD Beta V12 版本中升級的端到端神經網絡并不是端到端“完全體”,其依舊保留了部分感知與規控模塊的代碼。
上文有提及到,在推送了 FSD Beta V12.3 以及后續版本后,大洋彼岸的北美,同樣是馬斯克旗下的社交軟件 X 上迸發出了非常之多的“民間小視頻”。
但在諸多媒體/KOC/素人發布的視頻浪潮下,FSD 有一個非常耐人尋味的表現,并沒有遭到更多人的提及——在某些情況下,當智駕控制域的路線規劃要優于地圖導航路線規劃時,智駕控制域會給車輛發送行駛更優路線的指令。
在這段視頻中便體現了上一段的說法:車輛并沒有行駛地圖導航給出的掉頭路線,而是直接采用更優的左轉進入目的地。
正在加載 視頻播放器。 播放視頻 播放 靜音 當前時間 0:00 / 時長 0:00 加載完成: 0% 0:00 媒體流類型 直播 嘗試直播,當前為延時播放 直播 剩余時間 - 0:00 1x 播放速度 節目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開對話窗口。Escape鍵將取消并關閉對話窗口
文字 Color 白黑紅綠藍黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無浮雕壓低均勻下陰影 字體庫 比例無細體單間隔無細體比例細體單間隔細體舒適手寫體小型大寫字體 重置 恢復全部設定至預設值 完成 關閉彈窗結束對話窗口
無論是高速 NOA 還是城區 NOA ,其本質的核心人設都是一致的,那便是地圖導航位于路線規劃的最高優先級,正所謂 NOA 的全稱“領航輔助駕駛”,而特斯拉 FSD 卻似乎違背了這一點。
在沒有更近一步說明的情況下,我們尚無法根據這種行為做出更深層次的分析,但我們有著國內的內卷案例可供分析:全國都能開。
根據目前國內一些頭部智駕團隊負責人的說法,“全國都能開”的功能,本質上就是一種另類的 LCC 呈現方式——
首先意味著,當真正的“全國都能開”進行全民化普及,車輛上的 LCC 功能將有可能徹底會被 NOA/NCA 等代替;
其次,即使是“另類的 LCC”,LCC 功能本身,便不強依賴地圖導航路線信息……
看似風馬牛不相及的功能和技術路線,不同的市場環境,卻幾乎要走向相同的目標,不免令人有些驚訝。
在最近一次的 FSD 更新推送中,特斯拉徹底取締了“Beta”測試詞匯, 原先的“ FSD Beta ”更名為 “ FSD (Supervised) ”。
與此同時,特斯拉還刪除了部分說明,如「始終保持雙手握在方向盤上」、「這不會讓你的車自動化運行」、刪除數據采集同意協議……
馬斯克與他的特斯拉在自動駕駛的道路上走了多遠,在以前或許只有他自己,或者他的團隊們知道。但現在看來,似乎這位 AI 狂人,要開始向我們揭示自動駕駛新一輪的技術節點了。
當然,只要他不說出“全國都能開”(相信他知道這個梗),那特斯拉依舊還會是那個特斯拉,而不是標榜自己作為機器人公司,卻因為短期的汽車銷量下滑與傳統品牌舉例計較一二的“平庸車企”模樣。
來源:第一電動網
作者:新出行
本文地址:http://www.155ck.com/carnews/pingce/225376
以上內容轉載自新出行,目的在于傳播更多信息,如有侵僅請聯系admin#d1ev.com(#替換成@)刪除,轉載內容并不代表第一電動網(www.155ck.com)立場。
文中圖片源自互聯網,如有侵權請聯系admin#d1ev.com(#替換成@)刪除。