Projektowanie i sterowanie robotami o rozciągliwych, elastycznych korpusach

Fot. freepik

Naukowcy z MIT znaleźli sposób na optymalizację elastycznych robotów do wykonywania określonych zadań dzięki nowemu modelowi robota o rozciągliwej konstrukcji.

Naukowcy z MIT wynaleźli sposób na efektywną optymalizację sterowania i projektowania tzw. robotów miękkich (ang. soft robots) do wykonywania zadań docelowych, choć było karkołomnym przedsięwzięciem obliczeniowym.

Miękkie roboty mają sprężyste, elastyczne i rozciągliwe ciała, które poruszają się na nieskończoną liczbę sposobów w dowolnym momencie. Z obliczeniowego punktu widzenia stanowi to bardzo złożoną „reprezentację stanu”, która opisuje, jak porusza się każda część robota. Reprezentacje stanów dla miękkich robotów mogą mieć potencjalnie miliony wymiarów, co utrudnia obliczenie optymalnego sposobu wykonania przez robota złożonych zadań.

Na konferencji poświęconej neuronowym systemom przetwarzania informacji, która odbędzie się w przyszłym miesiącu, naukowcy z MIT zaprezentują model, który uczy się zwartej, czyli niskowymiarowej, ale szczegółowej reprezentacji stanu, bazując między innymi na fizyce robota i jego otoczenia. Pomaga to modelowi iteracyjnie optymalizować parametry kontroli ruchu i konstrukcji materiałowej, dostosowane do konkretnych zadań.

– Miękkie roboty to niewymiarowe stworzenia, które w każdej chwili wyginają się na miliony różnych sposobów – mówi Andrew Spielberg, student studiów magisterskich w Computer Science and Artificial Intelligence Laboratory (CSAIL). – Tak naprawdę istnieją naturalne sposoby, w jakie miękkie obiekty mogą się wyginać. Udowodniliśmy, że naturalne stany miękkich robotów można opisać bardzo zwięźle w niskowymiarowym opisie. Optymalizujemy sterowanie i projektowanie miękkich robotów poprzez uczenie się opisu prawdopodobnych stanów.

W symulacjach model ten umożliwił dwu- i trójwymiarowym miękkim robotom wykonanie zadań, np. przemieszczanie się na określone odległości lub dotarcie do miejsca docelowego – szybciej i dokładniej niż nawet najlepsze obecnie metody sterowania. Naukowcy planują wdrożyć ten model w rzeczywistych miękkich robotach.

„Nauczanie w pętli”

Miękka robotyka jest stosunkowo nową dziedziną, ale niesie ze sobą obietnicę postępu w branży robotyki. Elastyczne struktury robotów mogą np. zapewnić bezpieczniejszą interakcję z ludźmi, lepszą manipulację obiektami i większą zwrotność.

Sterowanie robotami w symulacjach opiera się na „obserwatorze”, czyli programie obliczającym zmienne, który widzi, jak miękki robot porusza się w celu wykonania zadania. W poprzedniej pracy badacze rozłożyli miękkiego robota na ręcznie zaprojektowane skupiska symulowanych cząstek. Cząstki zawierają ważne informacje, które pomagają zawęzić możliwe ruchy robota. Na przykład, jeśli robot próbuje zgiąć się w określony sposób, siłowniki mogą przeciwstawić się temu ruchowi na tyle, że można go zignorować. W przypadku tak złożonych robotów ręczne wybieranie klastrów, które mają być śledzone podczas symulacji, może być jednak kłopotliwe.

Opierając się na tej pracy, badacze opracowali metodę optymalizacji „uczenia się w pętli”, w której wszystkie zoptymalizowane parametry są uczone podczas pojedynczej pętli sprzężenia zwrotnego w wielu symulacjach. W tym samym czasie, gdy uczymy się optymalizacji – lub „w pętli” – metoda uczy się również reprezentacji stanu.

W modelu zastosowano technikę zwaną metodą punktów materialnych (MPM), która symuluje zachowanie się cząstek materiałów ciągłych, takich jak pianki i ciecze, otoczonych siatką podłoża. W ten sposób ujmuje cząstki robota i jego obserwowalne środowisko w piksele lub trójwymiarowe piksele, znane jako voxele, bez potrzeby dodatkowych obliczeń.

W fazie uczenia się te surowe informacje o siatce cząstek są podawane do komponentu uczenia maszynowego, który uczy się wprowadzać obraz, kompresować go do reprezentacji niskowymiarowej i dekompresować reprezentację z powrotem do obrazu wejściowego. Jeśli ten „autoenkoder” zachowa wystarczająco dużo szczegółów podczas kompresji obrazu wejściowego, może dokładnie odtworzyć obraz wejściowy po kompresji.

W pracy badaczy wyuczone przez autoenkoder skompresowane reprezentacje służą jako niskowymiarowa reprezentacja stanu robota. W fazie optymalizacji ta skompresowana reprezentacja wraca do kontrolera, który wysyła obliczoną aktywację dla sposobu, w jaki każda cząstka robota powinna się poruszać w następnym symulowanym przez MPM kroku.

Jednocześnie kontroler wykorzystuje te informacje do dostosowania optymalnej sztywności dla każdej cząstki, aby osiągnąć pożądany ruch. – W przyszłości informacje o materiałach mogą być wykorzystane do drukowania 3D miękkich robotów, gdzie każde miejsce cząstki może być wydrukowane z nieco inną sztywnością. Pozwala to na tworzenie projektów robotów dostosowanych do ruchów, które będą odpowiednie do danej aplikacji – mówi Spielberg. – Ucząc się tych parametrów naraz, utrzymujesz wszystko w synchronizacji, a proces projektowania staje się łatwiejszy.

Szybsza optymalizacja

Wszystkie informacje dotyczące optymalizacji są przekazywane z powrotem na początek pętli w celu wytrenowania auto-enkodera. W trakcie wielu symulacji sterownik uczy się optymalnego ruchu i rodzaju materiału, podczas gdy autoenkoder uczy się coraz bardziej szczegółowej reprezentacji stanu. – Kluczem jest to, że chcemy, aby ten niskowymiarowy stan był bardzo opisowy – mówi Spielberg.

Jak robot osiągnie symulowany stan końcowy w określonym czasie – powiedzmy, jak najbliżej miejsca docelowego – aktualizuje on „funkcję straty”. Jest to kluczowy element uczenia maszynowego, który stara się zminimalizować pewne błędy. W tym przypadku funkcja straty minimalizuje, jak daleko robot zatrzymał się od celu. Ta funkcja straty wraca do kontrolera, który wykorzystuje sygnał błędu do dostrojenia wszystkich zoptymalizowanych parametrów, aby jak najlepiej wykonać zadanie.

– Gdyby badacze próbowali bezpośrednio przekazać wszystkie surowe cząstki symulacji do kontrolera, bez kroku kompresji, „czas pracy i optymalizacji byłby ogromny”– podkreślaSpielberg. Używając skompresowanej reprezentacji, badacze byli w stanie skrócić czas działania każdej iteracji optymalizacji z kilku minut do około 10 sekund.

Badacze zweryfikowali swój model na symulacjach różnych dwu- i trójwymiarowych robotów dwu- i czterokołowych. Badacze odkryli również, że podczas gdy roboty korzystające z tradycyjnych metod mogą potrzebować do 30 000 symulacji, aby zoptymalizować te parametry, roboty wytrenowane na ich modelu potrzebowały jedynie około 400 symulacji.

Wdrożenie modelu do prawdziwych, miękkich robotów oznacza zmierzenie się z problemami związanymi z szumem i niepewnością występującymi w świecie rzeczywistym, które mogą obniżyć wydajność i dokładność modelu. Naukowcy mają jednak nadzieję, że w przyszłości uda im się zaprojektować cały proces tworzenia miękkich robotów, od symulacji po produkcję.


Rob Matheson, Biuro Informacyjne MIT.