Vytvořte si AI tutoriál na míru! Vyzkoušejte generátor tutoriálů a ušetřete čas.

Inženýři MIT vyvíjejí systém pro bezpečnou koordinaci robotů

Sdílet na sociálních sítích:
Napsal: Jan Kubice
Věda a technologie

Nová metoda z MIT zaručuje bezpečnou spolupráci robotů v přeplněném prostředí, s aplikací pro drony, skladové roboty i autonomní vozy.

Obrázek novinky

Inženýři MIT vyvíjejí systém pro bezpečnou koordinaci robotů

Představení dronů se stávají stále populárnějším způsobem velkolepých světelných show. Tyto show zahrnují stovky až tisíce létajících robotů, z nichž každý je naprogramován k letu po drahách, které společně tvoří složité tvary a vzory na obloze. Pokud vše probíhá podle plánu, jsou tyto show úchvatné. Pokud by však došlo k závadě jednoho nebo více dronů, jak se nedávno stalo na Floridě, v New Yorku a jinde, může to představovat vážné nebezpečí pro diváky na zemi.

Nehody při představeních dronů zdůrazňují problémy s udržováním bezpečnosti v takzvaných „multiagentových systémech“ – systémech několika koordinovaných, spolupracujících a počítačem programovaných agentů, jako jsou roboti, drony a autonomní automobily.

Tým inženýrů z MIT nyní vyvinul metodu pro výcvik multiagentových systémů, která dokáže zaručit jejich bezpečnou činnost v přeplněném prostředí. Vědci zjistili, že jakmile se tato metoda použije k vycvičení malého počtu agentů, bezpečnostní limity a ovládací prvky, kterých se agenti naučili, se automaticky rozšíří na jakýkoli větší počet agentů takovým způsobem, že je zaručena bezpečnost celého systému.

Při demonstracích v reálném světě tým vycvičil malý počet drony velikosti dlaně, aby bezpečně plnily různé úkoly, od současné výměny pozic za letu po přistání na určených pohyblivých vozidlech na zemi. V simulacích výzkumníci ukázali, že stejné programy, vycvičené na několika dronech, mohou být zkopírovány a zvětšeny na tisíce dronů, což umožňuje velkému systému agentů bezpečně plnit stejné úkoly.

„Toto by mohlo být standardem pro jakoukoli aplikaci, která vyžaduje tým agentů, jako jsou skladové roboti, drony pro pátrací a záchranné operace a autonomní automobily,“ říká Chuchu Fan, docentka letecké a kosmické techniky na MIT. „To poskytuje štít, nebo bezpečnostní filtr, kde každý agent může pokračovat ve svém úkolu a my vám řekneme, jak být v bezpečí.“

Fan a její kolegové o své nové metodě informují ve studii publikované tento měsíc v časopise IEEE Transactions on Robotics.

Bezpečnostní bariéry

Když inženýři navrhují bezpečnost v jakémkoli multiagentovém systému, obvykle musí zvážit potenciální dráhy každého jednotlivého agenta s ohledem na všechny ostatní agenty v systému. Toto plánování drah dvojic je časově náročný a výpočetně drahý proces. A ani potom není bezpečnost zaručena.

„V drone show dostane každý dron specifickou trajektorii – sadu waypointů a sadu časů – a pak v podstatě zavře oči a sleduje plán,“ říká Zhang, hlavní autor studie. „Jelikož vědí pouze, kde mají být a v jakou dobu, pokud se stane něco neočekávaného, nevědí, jak se přizpůsobit.“

Tým z MIT se místo toho zaměřil na vývoj metody pro výcvik malého počtu agentů pro bezpečnou manévrování, která by se mohla efektivně škálovat na jakýkoli počet agentů v systému. A namísto plánování specifických drah pro jednotlivé agenty by tato metoda umožnila agentům neustále mapovat jejich bezpečnostní limity, nebo hranice, za nimiž by mohly být v nebezpečí. Agent by pak mohl zvolit libovolný počet drah k dokončení svého úkolu, pokud zůstane v rámci svých bezpečnostních limitů.

V jistém smyslu, říká tým, je metoda podobná tomu, jak se lidé intuitivně pohybují v okolí.

„Představte si, že jste v opravdu přeplněném nákupním centru,“ vysvětluje So. „Nezaujímá vás nikdo, kdo není ve vašem bezprostředním okolí, řekněme 5 metrů kolem vás, pokud jde o bezpečné pohybování a zabránění nárazům do někoho. Naše práce zaujímá podobný lokální přístup.“

Bezpečnostní bariéra

Ve své nové studii tým představuje svou metodu GCBF+, která znamená „Graph Control Barrier Function“. Bariérová funkce je matematický termín používaný v robotice, který vypočítává jakousi bezpečnostní bariéru, nebo hranici, za kterou má agent vysokou pravděpodobnost, že bude v nebezpečí. Pro daného agenta se tato bezpečnostní zóna může měnit z okamžiku na okamžik, jak se agent pohybuje mezi ostatními agenty, kteří se sami pohybují v systému.

Když návrháři vypočítávají bariérové funkce pro jakéhokoli agenta v multiagentovém systému, obvykle musí brát v úvahu potenciální dráhy a interakce se všemi ostatními agenty v systému. Místo toho metoda týmu MIT počítá bezpečnostní zóny pouze několika agentů takovým způsobem, který je dostatečně přesný pro reprezentaci dynamiky mnohem většího počtu agentů v systému.

„Pak můžeme tuto bariérovou funkci jakoby zkopírovat a vložit pro každého jednotlivého agenta a najednou máme graf bezpečnostních zón, který funguje pro libovolný počet agentů v systému,“ říká So.

Pro výpočet bariérové funkce agenta metoda týmu nejprve vezme v úvahu „snímací poloměr“ agenta, nebo jak velkou část okolí agent může pozorovat v závislosti na jeho snímacích schopnostech. Stejně jako v analogii s nákupním centrem, výzkumníci předpokládají, že agenta zajímají pouze agenti, kteří se nacházejí v jeho snímacím poloměru, pokud jde o zachování bezpečnosti a vyhýbání se kolizím s těmito agenty.

Poté, s použitím počítačových modelů, které zachycují specifické mechanické schopnosti a limity agenta, tým simuluje „ovladač“, nebo sadu instrukcí pro to, jak se agent a hrstka podobných agentů mají pohybovat. Poté spustili simulace s pohybem více agentů po určitých drahách a zaznamenali, zda a jak se srazili, nebo jinak interagují.

„Jakmile máme tyto trajektorie, můžeme vypočítat některé zákony, které chceme minimalizovat, například počet bezpečnostních porušení v aktuálním ovladači,“ říká Zhang. „Pak aktualizujeme ovladač, aby byl bezpečnější.“

Tímto způsobem může být ovladač naprogramován do skutečných agentů, což jim umožní neustále mapovat jejich bezpečnostní zónu na základě všech ostatních agentů, které mohou vnímat ve svém bezprostředním okolí, a poté se v této bezpečnostní zóně pohybovat, aby dokončili svůj úkol.

„Náš ovladač je reaktivní,“ říká Fan. „Neplánujeme předem cestu. Náš regulátor neustále přijímá informace o tom, kam agent směřuje, jaká je jeho rychlost, jak rychle se pohybují jiné drony. Všechny tyto informace používá k vytvoření plánu za běhu a plánuje znovu a znovu. Pokud se tedy situace změní, je vždy schopen se přizpůsobit, aby zůstal v bezpečí.“

Tým demonstroval GCBF+ na systému osmi Crazyflies – lehkých, dlaňových kvadrotorových dronů, které pověřili létáním a přelétáváním pozic ve vzduchu. Pokud by drony postupovaly po nejkratší cestě, jistě by došlo ke srážce. Ale po tréninku s metodou týmu se drony dokázaly v reálném čase se přizpůsobit a vyhýbat se navzájem, aniž by opustily své bezpečnostní zóny, a úspěšně si v letu vyměnily pozice.

Podobně tým pověřil drony létáním a následným přistáním na specifických Turtlebotech – kolových robotech s vrchní částí podobnou skořápce. Turtleboti se nepřetržitě pohybovali v širokém kruhu a Crazyflies se jim dokázaly úspěšně vyhnout při přistání, aniž by došlo ke kolizi.

„S použitím našeho rámce musíme dronům sdělit pouze jejich cíle, nikoliv celou trajektorii bez kolizí, a drony si samy dokáží vypočítat, jak se dostat do cíle bez kolize,“ říká Fan, která si představuje, že tato metoda by se mohla použít pro jakýkoli multiagentový systém s cílem zaručit jeho bezpečnost, včetně systémů pro vyhýbání se kolizím v drone show, skladových robotech, autonomních vozidlech a systémech pro doručování dronů.

Tato práce byla částečně podpořena americkou Národní vědeckou nadací (NSF), laboratoří MIT Lincoln v rámci programu Safety in Aerobatic Flight Regimes (SAFR) a agenturou Defence Science and Technology Agency of Singapore.

Související články

Sdílet na sociálních sítích:

Komentáře

Zatím žádné komentáře. Buďte první, kdo napíše svůj názor!