Popular science work
據(jù)美國(guó)麻省理工學(xué)院官網(wǎng)近日?qǐng)?bào)道,該機(jī)構(gòu)研究人員為了訓(xùn)練更先進(jìn)的多用途機(jī)器人,開(kāi)發(fā)出一種技術(shù):使用一種稱為擴(kuò)散模型的生成式人工智能(AI),可將不同領(lǐng)域、不同形式的多個(gè)數(shù)據(jù)源整合起來(lái),用于多種任務(wù)。
假設(shè)你想訓(xùn)練一個(gè)機(jī)器人,讓它了解如何使用工具,然后快速學(xué)會(huì)用錘子、扳手和螺絲刀來(lái)維修你的房子。為此,你需要大量數(shù)據(jù)來(lái)演示工具的使用。
現(xiàn)有的機(jī)器人數(shù)據(jù)集在形式上差異很大。例如,有些包括彩色圖像,而另一些則由觸覺(jué)印記組成。數(shù)據(jù)也可在不同的領(lǐng)域收集,如模擬或人工演示。每個(gè)數(shù)據(jù)集都可能包含一個(gè)獨(dú)特的任務(wù)和環(huán)境。
在一個(gè)機(jī)器學(xué)習(xí)模型中,很難有效地將眾多來(lái)源的數(shù)據(jù)整合在一起,因此許多模型僅使用一種類型的數(shù)據(jù)來(lái)訓(xùn)練機(jī)器人。但是,以這種方式訓(xùn)練的機(jī)器人,在某些特定任務(wù)方面的數(shù)據(jù)相對(duì)較少,通常無(wú)法在不熟悉的環(huán)境中執(zhí)行新任務(wù)。
研究人員此次改變策略,訓(xùn)練了一個(gè)單獨(dú)的擴(kuò)散模型,讓它學(xué)習(xí)使用一個(gè)特定數(shù)據(jù)集來(lái)完成一項(xiàng)任務(wù)。然后,他們將擴(kuò)散模型的學(xué)習(xí)策略組合成一個(gè)通用策略,使機(jī)器人能在各種設(shè)置中執(zhí)行多項(xiàng)任務(wù)。
在模擬和真實(shí)世界的實(shí)驗(yàn)中,這種訓(xùn)練方法使機(jī)器人能使用多種工具,并適應(yīng)訓(xùn)練期間沒(méi)有學(xué)過(guò)的新任務(wù)。與基線技術(shù)相比,這種策略組合將任務(wù)性能提高了20%。
研究人員表示,解決機(jī)器人數(shù)據(jù)集中的異質(zhì)性就像一個(gè)先有雞還是先有蛋的問(wèn)題。如果想使用大量數(shù)據(jù)來(lái)訓(xùn)練通用機(jī)器人,首先需要可部署的機(jī)器人來(lái)獲取所有這些數(shù)據(jù)。利用所有可用的異質(zhì)數(shù)據(jù),類似于研究人員對(duì)ChatGPT所做的工作,是機(jī)器人領(lǐng)域發(fā)展的重要一環(huán)。