蓋世汽車訊 可與物理世界互動的具身AI(人工智能)代理在各種應用中都具有巨大潛力,但缺乏訓練數(shù)據(jù)仍是其面臨的主要障礙之一。據(jù)外媒報道,為解決該挑戰(zhàn),英國倫敦帝國理工學院(Imperial College London)和谷歌DeepMind的研究人員推出了一種名為擴散增強型代理(Diffusion Augmented Agent,DAAG)的新型框架,利用了大型語言模型(LLM)、視覺語言模型(VLM)以及擴散模型的力量,以提升具身代理的學習效率和遷移學習能力。
DAAG模型(圖片來源:arXiv)
為何數(shù)據(jù)效率對具身代理很重要?
近年來,LLM和VLM取得了令人驚嘆的進展,為其應用于機器人和嵌入式AI領域帶來了希望。但是,雖然LLM和VLM可以在從互聯(lián)網上抓取來的大量文本及圖像數(shù)據(jù)集上進行訓練,但是具身AI系統(tǒng)需要通過與物理世界的交互來學習。
現(xiàn)實世界對具身AI系統(tǒng)的數(shù)據(jù)收集提出了幾個挑戰(zhàn)。首先,物理環(huán)境比數(shù)字世界更加復雜和不可預測。其次,機器人和其他具身AI系統(tǒng)依賴于物理傳感器和執(zhí)行器,而此類傳感器和執(zhí)行器可能會有速度慢、有噪聲、易故障等問題。研究人員們認為,克服這一障礙的關鍵在于更有效地利用該代理現(xiàn)有的數(shù)據(jù)和經驗。
DAAG是什么?
來源:第一電動網
作者:蓋世汽車
本文地址:http://www.155ck.com/news/shichang/241598
以上內容轉載自蓋世汽車,目的在于傳播更多信息,如有侵僅請聯(lián)系admin#d1ev.com(#替換成@)刪除,轉載內容并不代表第一電動網(www.155ck.com)立場。
文中圖片源自互聯(lián)網,如有侵權請聯(lián)系admin#d1ev.com(#替換成@)刪除。