今年,“AI+”成為推動經濟增長和社會進步的新質生產力,而大模型上車也成為汽車行業擁抱新質生產力的主要方向。據不完全統計,現階段已有遠超10家汽車品牌搭載大模型,而隨著各大車企相繼官宣人工智能大模型相關的戰略布局,“軟件定義汽車”時代也開始向“AI定義汽車”過渡,汽車行業迎來新的增長點,產業鏈加速融合。
大模型在汽車的應用涵蓋車聯網、高級輔助駕駛、智能座艙等多個場景,如打造信息交互協同的智慧出行系統、感知環境并做出判斷、打造定制化服務等。而在眾多場景中,車載語音交互是大模型上車智能座艙領域的第一站。
對于車企而言,將先進的大模型技術融入車載語音系統至關重要,能夠以更高的效率、更低的成本達到更智能化的體驗。
對此,在蓋世汽車2024第二屆汽車人工智能大會上,思必馳智能汽車事業部高級產品總監曾春華談到,隨著多模融合大模型的發展,多模態跨領域交互、類人交互、以及終端車載家庭互聯場景融合的時代終將到來,“大模型+大融合”將重新定義智能汽車人機交互。
曾春華 | 思必馳 智能汽車事業部高級產品總監
智破大模型引入痛點,思必馳匠心打造“1+N”模式
隨著車廠對大模型能力的需求日益旺盛,引入大模型產生的痛點、難點也逐漸暴露。
首先,大模型的引入容易對現有的技術鏈路產生影響,如何實現不同廠商大模型的融合、調度和分配成為車企面臨的一大挑戰。其次,隨著大模型規模的日益龐大,反饋速度也逐漸放緩,而這在需要毫秒級響應速度的車載場景中尤為關鍵。
面向生態融合,為助力車廠解決以上痛難點,思必馳基于自研全鏈路智能語音語言交互技術、DFM大模型以及大數據構建“中樞大模型”架構,打造“1+N”模式,即“1”個百模中臺(中樞大模型)與“N”個專業大模型組合上車,打通前端語言處理、用車場景與后端模型生態,形成車載垂域的生態圈,使車載AI體驗從“語音指令”邁向“語言智能”+“工具智能”,將吸納眾多頂尖的大模型廠商構建一個強大的語音交互系統,以匯聚不同大模型的技術特點與優勢,提供更加全面、精準的語音服務。
圖源:思必馳
這涉及技術架構的升級,特別是從單一大模型到以中樞大模型為底座的多模型融合車載Agent框架,同時確保端側與云側分布式部署,支持解耦,便于后續輕量化升級,并通過新的大模型云端框架,支持垂域模型實現插拔式靈活升級。
調動不同大模型、實現技術落地并與現有語音系統完美融合,是智能座艙發展的重要方向。模型融合過程主要涉及兩個方向:
首先,是大小模型的縱向融合。大模型具有語義理解、任務推理等強大能力,但并不能完全替代小模型。在某些基礎和垂直行業領域,小模型具備精準分類、響應快速等特點,仍不可或缺。因此,需要實現小模型與大模型的協同工作,確保兩者之間的調度關系得當。
其次,是大模型的橫向生態融合,如聚焦于多模理解、文本生成、圖片生成、音頻生成等不同領域大模型的融合。
這意味著在眾多大模型中選擇最適合的,圍繞車的場景進行全新的、更智能的語音交互理解,包括大模型的場景推薦,以及人格化、情感化的融合。
聚焦多元車載場景,重塑語音交互體驗
國內乘用車語音控制功能滲透率持續上升。據蓋世汽車研究院統計,2023年,累計語音控制功能滲透率超過75%。預計到2025年,國內語音交互產品滲透率將達92%,市場規模將達23億元。
隨著用戶對車載語音交互體驗需求的提升,各語音功能搭載量均呈現出明顯的上升趨勢。
思必馳積極探索車載應用場景,特別關注用戶的高頻需求。用戶在車上主要關注導航、車控、多媒體、電話以及天氣查詢等功能。其中,自定義喚醒詞的需求尤為突出,這反映了用戶對個性化、智能語音交互“千人千面”的預期。
圖源:思必馳
針對以上高頻場景,思必馳重點發力進行技能重構。出行是人們日常生活中的重要部分,無論是上下班、出差還是休閑娛樂,行程規劃都是關鍵一環。在這個過程中,導航成為車載語音交互的重要應用場景。傳統導航流程繁瑣,思必馳大模型的引入能夠實現“一步到位”的便捷體驗,通過出行規劃功能,用戶只需簡單一句話,即可快速生成出行方案并導航至目的地。
圖源:思必馳
車載語音交互還涉及諸多其他場景,如車控、娛樂等。特別是當車輛出現故障或交通事故時,用戶需要快速獲取解決方案。思必馳大模型能夠結合豐富的數據和知識,為用戶提供及時、準確的反饋和建議。此外,用戶對車輛的情感化需求也在逐漸增長,思必馳大模型可以結合用戶的個性化需求,提供更為貼心、智能的服務。
據介紹,目前,基于多模融合大模型方案打造的“天琴語音助手”7.0版本可以實現多人設自由切換、大模型行程規劃、跨域上下文意圖理解、一句話百變壁紙等多個首創式落地應用。全域端到端速度以及多輪對話語音合成速度均可控制在3s以內,拒識+響應的整體準確率在92.7%,其中非閑聊類準確率可達98%以上,大大降低用戶閑聊聲音對座艙交互的影響。
堅持對話式AI技術積累,思必馳持續發力汽車語音交互場景
思必馳是國內專業的對話式人工智能平臺型企業,基于自研的全鏈路智能對話系統定制開發平臺、語言計算大模型DFM、人工智能語音芯片,圍繞“云+芯”布局,為物聯網、數字政企領域提供軟硬件結合的人工智能技術與產品服務。
思必馳的核心優勢在于全鏈路語音交互技術、軟硬一體化人機對話系統構建能力以及大規模對話系統定制能力。憑借在行業的核心技術積累,思必馳將全鏈路智能對話定制平臺(即DUI平臺)與DFM-2大模型相結合,支持客戶自主構建 “千人千面” 的個性化語音交互解決方案,實現大規模、高質量、個性化的人工智能系統定制。
近年來,思必馳以提升語音識別的準確性、交互的自然性以及系統的智能化水平為目標,實現了多項創新和突破:累計牽頭、參與制定了70項國家/行業/團體標準,范圍涉及語音合成、語音識別、聲紋識別、機器學習、智能能力等級、自然語言處理等;擁有近100項全球獨創技術,已授權知識產權近1500件,獲得23項產品、技術相關優秀認證,并多次在國際評測中奪得冠軍。
深耕于汽車行業多年,思必馳擁有多年車載語音經驗。從最初的車載語音系統,到如今的多模融合大模型方案,始終以滿足用戶需求為核心。
2022年,思必馳汽車語音交互方案(天琴助手)通過了中國信通院可信AI評測,并獲得L9級智能認證,是國內目前已知的最高車載語音交互產品的智能等級認證。
2023年,思必馳大模型在智能座艙的應用案例成功入選由中國質量認證中心和中關村智用人工智能研究院聯合發布的《大模型行業應用白皮書》,彰顯思必馳大模型在實際應用場景的落地能力。思必馳參與編制的國內首個汽車大模型標準也于近期正式發布(《面向行業的大規模預訓練模型技術和應用評估方法 第4部分:汽車》標準),聚焦汽車行業高質量發展,助推汽車大模型產品升級優化。
2024年,思必馳升級大模型技術全場景方案應用,并開啟出海戰略,在汽車領域,一方面加大與海外車企的本土化合作,一方面伴隨中國新能源車企“走出去”。由思必馳主導,聯合中國信息通信研究院、中國電信提出的車載多音區語音交互國際標準(Framework and requirement for in-vehicle multi-region intelligent speech interaction system/車載多音區語音交互系統的框架與要求),于4月份在法國獲國際電信聯盟標準化局(ITU-T)第16研究組(SG16)討論并立項。這也是在該領域中,首個由中國公司牽頭制定的新一代汽車語音交互國際標準。
目前,思必馳已與近60家汽車品牌合作,包括新勢力品牌、自主品牌及國際巨頭,產品已應用于160多款量產車型,累計裝車量突破1000萬臺。在車載語音領域,思必馳增速顯著,國內新能源車載語音市場占有率第一,在車載語音全行業躋身Top 3。
圖源:思必馳
曾春華表示,思必馳致力于與大模型廠商和車廠合作,共同推動車載語音交互技術的發展。同時,思必馳也將關注多模態交互、車家生態融合等前沿技術,不斷提升車載語音交互的智能化水平。思必馳希望借助全鏈路語音技術,通過中樞大模型的調度和融合能力,打造車載垂域生態圈,為用戶帶來更為便捷、智能的出行體驗!
來源:第一電動網
作者:蓋世汽車
本文地址:http://www.155ck.com/news/shichang/232415
以上內容轉載自蓋世汽車,目的在于傳播更多信息,如有侵僅請聯系admin#d1ev.com(#替換成@)刪除,轉載內容并不代表第一電動網(www.155ck.com)立場。
文中圖片源自互聯網,如有侵權請聯系admin#d1ev.com(#替換成@)刪除。