Učení napodobováním: Roboti se naučili prostřít stůl pozorováním lidí

Jeden z nejefektivnějších budoucích způsobu trénování algoritmů robotů by mohla být prostá nápodoba: Něco, co je i člověku velmi blízké.

Současné metody trénování robotů nejčastěji spoléhají na přímé programování, metody pokus-omyl nebo různé formáty učení s učitelem, učení bez učitele nebo zpětnovazebního učení.

„Improvizující“ roboti

Vědci Z MIT ale nově navrhli a vyvinuli systém PUnS (Planning with Uncertain Specifications), která má roboty snadno vytrénovat k jednoduchému naučení jinak komplikovaných činností. PUnS nestaví na klasické metodě „odměny“ za správně vykonanou akci, ale namísto toho využívá – velmi zjednodušeně a mírně nepřesně řečeno – systém „přesvědčení“. Pomocí logiky lineárního času (LTL) se robot „rozhoduje“, co má nyní a v budoucnu dělat.

Tým vědců stanovil robotům kritéria, která povedou ke splnění celkového přesvědčení; kritéria se mohou značně lišit, může jít o důraz na nejvyšší pravděpodobnost (tedy třeba spolehlivost) nebo nejnižší šanci selhání. Vývojář by tak mohl optimalizovat robota pro bezpečnost, třeba při práci s rizikovými materiály, nebo naopak na konzistentní, stálou kvalitu u továrních robotů.

Systém MIT se zdá dosti efektivním; ve 20 tisících pokusech o prostření stolu se robot spletl pouze 6x, což je výtečná statistika; a to se počítají i pokusy, kdy vědci například „schovali“ robotovi vidličku. Byl schopen se přizpůsobit, stůl prostřít a poté vidličku přidat, když se „objevila“. Stroje tak prokázali člověku blízkou vlastnost – improvizaci a důraz na konečný výsledek, byť stále podmíněný především předchozí prací týmu vědců.

V pozdějších iteracích by měl být systém schopen reagovat na zpětnou vazbu. Celý proces bude vyžadovat ještě hodně práce, ale pokud se uchytí, mohl by změnit způsob trénování algoritmů a interakce s roboty.

Zdroj: MIT, IEEE, obrázky: MIT

Odebírat
Upozornit na
guest
0 Komentářů
Inline Feedbacks
View all comments
Obrázek: S drony nejsou žerty. Muž s Kalifornie čelí hrozbě vězení za srážku dronu s policejní helikoptérou
S drony nejsou žerty. Muž s Kalifornie čelí hrozbě vězení za srážku dronu s policejní helikoptérou
Obrázek: Robotický kuchař zvládne 5 000 receptů, v kuchyni si vystačí sám
Robotický kuchař zvládne 5 000 receptů, v kuchyni si vystačí sám
Obrázek: Čtení knih na mobilu? Honor používá funkci eBook simulující displeje čteček knih
Čtení knih na mobilu? Honor používá funkci eBook simulující displeje čteček knih
Obrázek: Proč dítě pláče? Počítač dokáže s 90% úspěšností detekovat důvod
Proč dítě pláče? Počítač dokáže s 90% úspěšností detekovat důvod
Obrázek: Jak zjistit zapomenuté heslo K WiFi? Snadno v PC i na mobilu
Jak zjistit zapomenuté heslo K WiFi? Snadno v PC i na mobilu
Obrázek: Elon Musk pobídl uživatele k odchodu: Jak přejít z WhatsAppu na bezpečnější Signal?
Elon Musk pobídl uživatele k odchodu: Jak přejít z WhatsAppu na bezpečnější Signal?
Obrázek: Uživatel upravil Cyberpunk 2077: Hru můžete hrát i z pohledu třetí osoby
Uživatel upravil Cyberpunk 2077: Hru můžete hrát i z pohledu třetí osoby
Obrázek: Bitcoin na cestě k 1 000 000 Kč: Jak v Česku výhodně koupit bitcoiny?
Bitcoin na cestě k 1 000 000 Kč: Jak v Česku výhodně koupit bitcoiny?
Obrázek: Neznámí velikáni: Hedy Lamarr, smyslná kráska s podceňovanou inteligencí
Neznámí velikáni: Hedy Lamarr, smyslná kráska s podceňovanou inteligencí

Rakousko-americká herečka Hedy Lamarr se, vpravdě, oproti ostatním jménům v naší sérii neznámých velikánů liší: Není totiž neznámá. Proslavila se ovšem...

Zavřít