2022年12月16日-17日,由安徽省發(fā)展和改革委員會(huì)作為指導(dǎo)單位,合肥市人民政府、中國(guó)電動(dòng)汽車百人會(huì)聯(lián)合主辦的“2022全球智能汽車產(chǎn)業(yè)峰會(huì)”在安徽合肥召開。本屆論壇圍繞“全球新變局與智能汽車發(fā)展新戰(zhàn)略”主題,共設(shè)置5個(gè)主題論壇和2場(chǎng)閉門會(huì)議,與行業(yè)機(jī)構(gòu)、高校院所和領(lǐng)先企業(yè)代表共同探索我國(guó)智能汽車發(fā)展新路徑。
其中,在12月17日舉辦的“生態(tài)論壇”上,后摩智能創(chuàng)始人兼 CEO 吳強(qiáng)發(fā)表精彩致辭。以下內(nèi)容為現(xiàn)場(chǎng)演講實(shí)錄:
大家上午好!很高興能代表后摩智能參加這個(gè)峰會(huì),我今天分享的主題是《如何以自主創(chuàng)新打造更自主可控的智能駕駛芯片》。
汽車電動(dòng)化和智能化給國(guó)產(chǎn)汽車帶來難得的歷史機(jī)遇,PPT左圖顯示了我國(guó)電動(dòng)化的普及程度已經(jīng)在世界前列,右圖展示了我們?cè)谥悄荞{駛L2及以上的普及率、滲透率也是走在世界前列。L2及以上的智能駕駛給計(jì)算芯片帶來新的需求,比如,和傳統(tǒng)的車載芯片MCU相比,智能駕駛芯片的復(fù)雜度、大算力更接近于以前云端芯片或者超算芯片;設(shè)計(jì)、封裝等等方面,跟傳統(tǒng)的MCU都不太一樣。智能駕駛芯片的算力要求接近于傳統(tǒng)的超算芯片,很多人說智能駕駛芯片是一個(gè)移動(dòng)的超算中心。
另外,低功耗。在傳統(tǒng)的超算中心我對(duì)功耗不是那么敏感,我在數(shù)據(jù)中心有用電,有空調(diào),有冷卻,但是在車上面,用電有很多問題。大家都是汽車方面的專家,汽車是電池驅(qū)動(dòng),另外汽車散熱系統(tǒng)其實(shí)比較緊張,環(huán)境溫度要求比較高。
第三,低成本。超算成本方面,一個(gè)芯片很貴,基于A100的服務(wù)器可以賣幾十萬,一個(gè)企業(yè)就需要幾臺(tái)。但是對(duì)于車來講,剛才沈總說了,我們希望讓每輛車都用得起、買得起、裝得起這樣的芯片。我們大部分的車都是在10萬—30萬人民幣之間,這部分車是主流,高端車是另外一個(gè)故事。對(duì)于10萬—30萬人民幣的汽車來說,成本非常敏感,怎么能夠做出高性價(jià)比,讓每輛車都裝得起芯片,這也是一個(gè)新的需求。
最近幾年我們才遇到一個(gè)新話題,把原來做超算中心大算力芯片的人和做傳統(tǒng)車載芯片的人融合到一起。這是近幾年才出現(xiàn)的有趣現(xiàn)象。
對(duì)于L2芯片的發(fā)展趨勢(shì),算力要求適中,對(duì)于L2+或者L2++的芯片或者更高級(jí)的芯片,最近的發(fā)展趨勢(shì)也有很多。它的傳感器數(shù)量越來越多,因?yàn)橐粩嘀С諰1、L2,要支持L2+甚至L2++。傳感器越來越多,對(duì)算力需求變得越來越高。第二,對(duì)于L2++,一些智能駕駛算法也變得越來越復(fù)雜,要求不停迭代,BEV要出來,Transformer要出來,對(duì)芯片的開放程度也要求很高。這是高階智能駕駛目前帶來一些新的需求,特別在最近幾年。
目前的解決方案有幾個(gè)問題,第一個(gè)要依賴于先進(jìn)的制造工藝,傳統(tǒng)MCU 40nm就算挺好的,最多28nm,現(xiàn)在智能駕駛都向16、14、7甚至5或3nm走。先進(jìn)工藝帶來兩個(gè)問題:1、成本奇貴,做一顆7nm芯片研發(fā)成本需要1億多美元,7nm要幾億美元,分?jǐn)傁聛?,裝到車上,就很貴;2、容易被卡脖子,現(xiàn)在這種大形勢(shì)下,非常容易被卡脖子。這是一種問題。
另外,犧牲通用性、解決效率問題,需要算力、需要功耗,我怎么去解決這些問題?如果我做得很專用,專用又不符合整個(gè)算法的發(fā)展趨勢(shì)。這就是一對(duì)矛盾,這是目前在高階智能駕駛芯片上面臨的矛盾。算力越大,帶來的功耗越來越大,解決這個(gè)問題,面臨著芯片怎么部署下去,是不是都需要液冷?高端車肯定是液冷,對(duì)于低端車,如果用液冷,整個(gè)系統(tǒng)的復(fù)雜度上升,成本又會(huì)上去,又回到“怎么讓每輛車用得起、裝得起”的問題。
我們需要的,不能依賴于繼續(xù)往先進(jìn)制程工藝走的做法,是不是可以從更底層的架構(gòu)創(chuàng)新或者技術(shù)創(chuàng)新,去解決這樣的問題?更底層的創(chuàng)新方法同樣可以把算力問題、功耗問題、成本問題解決。這個(gè),也許是我們國(guó)產(chǎn)芯片廠商需要探索的問題。在所有的技術(shù)創(chuàng)新方向里面,有一個(gè)方向非常有希望,即存算一體,它的意思把存儲(chǔ)、計(jì)算融為一體,重構(gòu)智能駕駛芯片。傳統(tǒng)的計(jì)算架構(gòu)在教科書上學(xué)的馮諾伊曼架構(gòu),計(jì)算和存儲(chǔ)是分離的,每次通過總線去load數(shù)據(jù),計(jì)算完再放回去,這是馮諾伊曼架構(gòu)。這種計(jì)算架構(gòu)適合于傳統(tǒng)的CPU,已經(jīng)有60年的歷史,做CPU非常合適,對(duì)于智能駕駛芯片是AI計(jì)算,是數(shù)據(jù)為主的計(jì)算,這是近幾年才出現(xiàn)的事情。這種事情其實(shí)不太合適,數(shù)據(jù)總線變成一個(gè)瓶頸。另外,算力上不去,或者算力上去,但要花費(fèi)很大的成本。我的數(shù)據(jù)不停地搬運(yùn),做了很多無效的搬運(yùn),造成大量功耗,這是存算一體。希望從底層架構(gòu)創(chuàng)新或者計(jì)算方式的創(chuàng)新根本性解決這樣的問題。
算力做大,可以不用這種很高階的、很昂貴的先進(jìn)工藝可以把算力做上去,另外避免了大部分的數(shù)據(jù)搬運(yùn),90%的數(shù)據(jù)都可以把它省下來,也節(jié)省了功耗,同時(shí)也節(jié)省了成本,這個(gè)是我們?cè)诤芏鄻I(yè)內(nèi)同仁探索新的技術(shù)方向。舉個(gè)例子,存算一體本身能效,仍然有一個(gè)數(shù)量級(jí)的提升,這是技術(shù)上的優(yōu)勢(shì)。反映在產(chǎn)品上面,能做到什么?比如大家很多都是汽車專家,知道汽車需要散熱,散熱有幾種方式,自然風(fēng)冷、風(fēng)扇、液冷,對(duì)于大部分車廠來說,最希望的方式是自然風(fēng)冷或者自然冷或者被動(dòng)散熱,成本更低,系統(tǒng)復(fù)雜度更低,但是有一個(gè)剛需,功耗在15瓦或者20瓦以內(nèi)。如果想要大算力,本身和低功耗就是天生的矛盾,怎么解決這個(gè)問題?我想自然散熱或者低功耗,必然我的算力不高,只能做一些十幾T到20T,按照目前的工藝做到極限。除非走更昂貴的5nm、3nm,可以把這個(gè)數(shù)字再往上走,如果用正常的工藝只能做到這個(gè)數(shù)字。如果用存算一體,也許能夠突破這個(gè)極限,在自然散熱的情況下能做到60T或者80T甚至100T,這其實(shí)是我們希望去探索或者實(shí)現(xiàn)的目標(biāo),這是存算一體帶來產(chǎn)品層面實(shí)實(shí)在在的收益。
此外,存算一體還有另外一個(gè)好處,它可以用相對(duì)成熟的工藝去做出媲美先進(jìn)工藝的算力和能效比,在現(xiàn)在的國(guó)際大環(huán)境下,它有一些特殊的意義。即使有極端情況出現(xiàn),還是可以不被卡脖子,能實(shí)現(xiàn)國(guó)產(chǎn)自主可控。這還是能打造一個(gè)可以幫助國(guó)產(chǎn)汽車智能化推進(jìn)的高能效比、高性能的芯片,這是目前在國(guó)際形勢(shì)下另外一個(gè)特殊的意義。
下面介紹一下后摩智能,成立于2020年底,公司兩撥人,一撥做存算一體的專家,來自于學(xué)術(shù)背景的技術(shù)專家,還有一撥人像我在工業(yè)界做了20年,做過大芯片、高算力芯片,以前我做云端芯片,后來做過車端芯片。兩撥人在一起探索,一起去碰撞,發(fā)現(xiàn)這些問題,我們覺得這可能是一個(gè)解決高算力或者高性能智能駕駛芯片的根本解決方案。我們這撥人成立了這家公司,目前大概兩年左右。去年8月份做了第一顆流片,是一顆技術(shù)樣片,在今年年初跑通了智能駕駛的算法和demo,今年第一顆芯片順利投片,很快希望在明年上半年春節(jié)之后能給客戶去試用。
我們第一顆芯片基于存算架構(gòu)一體芯片的設(shè)計(jì),時(shí)間關(guān)系不具體講,總體來說,PPT上從右向左,橙色的部分基于存算的計(jì)算盒,后面是分布式計(jì)算單元,不同的計(jì)算單元組成AI Core,最后變成一個(gè)HOC,呈現(xiàn)給汽車或者Tier1或者車上的客戶。
去年第一顆芯片流片,成功把它運(yùn)行了常規(guī)的智能駕駛算法點(diǎn)亮。這里PPT上有一個(gè)簡(jiǎn)單的demo,20秒時(shí)間,基于第一顆大算力芯片跑的常規(guī)智能駕駛場(chǎng)景。常規(guī)11種檢測(cè)、分割、識(shí)別等等算法,都是跑在存算一體芯片上面,可以看到框是檢測(cè),地面是各種分割,它的效果和傳統(tǒng)的GPU很相似,我們也可以達(dá)到相似或者更好的效果。
從軟件的角度,我們是一家智能駕駛芯片公司,我在行業(yè)做了很多年,我知道客戶是怎么想的,客戶還是希望軟件能夠盡可能接近巨頭英偉達(dá)的編程模式,客戶遷移起來最方便,我們采用了類CUDA的編程方式,降低客戶的開發(fā)成本。
整個(gè)算法和軟件的發(fā)展趨勢(shì)是軟硬解耦的,我們希望自己基于軟硬解耦的理念,把我們的芯片和工具鏈做得盡可能開放,這樣有更多的第三方算法公司或者Tier1或者主機(jī)廠一起在上面以比較快的速度開發(fā)自己的軟件,這也是我們自己的理念。整個(gè)芯片和軟件都是基于這個(gè)理念去設(shè)計(jì),也是我們跟Mobileye黑盒模式的區(qū)別。
這兩年,從第一代芯片流片,到現(xiàn)在跟一些客戶合作,主要是在無人車像物流、零售、乘用車方面,在Tier1層面和主機(jī)廠合作。總體來說,后摩智能的愿景是做后摩爾時(shí)代的智能計(jì)算平臺(tái),公司的名字也是來自于這個(gè)愿景。目前我們其實(shí)聚焦在無人車和智能駕駛和乘用車,這是我們主要目前聚焦的場(chǎng)景,希望在這兩個(gè)領(lǐng)域能夠落地站住腳,希望跟更多的合作伙伴去做。未來萬物智能的時(shí)代,希望我們能有更多為仿生機(jī)器人、AR/VR這些場(chǎng)景提供高效率的智能計(jì)算平臺(tái),為萬物智能這個(gè)美好的愿景目標(biāo)盡我們公司的一份綿薄之力。
以上就是我的分享,謝謝大家!
(注:本文根據(jù)現(xiàn)場(chǎng)速記整理,未經(jīng)演講嘉賓審閱)
來源:蓋世汽車
作者:蓋世直播君
本文地址:http://www.155ck.com/news/qiye/191965
以上內(nèi)容轉(zhuǎn)載自蓋世汽車,目的在于傳播更多信息,如有侵僅請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)(www.155ck.com)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。