В МФТИ разработан алгоритм оптимальной траектории движения беспилотника в пространстве с препятствиями

Ученые МФТИ представили уникальный алгоритм POLAMP, который планирует оптимальный путь для беспилотного объекта от заданной начальной точки к конечной в среде с различными препятствиями. Коэффициент успешности модели составил 92%. Исследование опубликовано в международном научном журнале Eeee robotics and automation letter.

Роботы-беспилотники все активнее используются в городской среде. Методы построения траектории движения робота, в одном пространстве с которым находятся статические и движущиеся объекты, - одно из самых востребованных направлений в современной робототехнике.

Традиционно для генерации маршрута пути используются два подхода: так называемое глобальное и локальное планирования. Первый основывается на построении карты окружающей среды (дерева) посредством множества опорных точек в изменяемом пространстве движения. Второй – на сборе информации о различных ограничителях и помехах на небольших участках движения.

Ученые МФТИ совместно с коллегами из AIRI использовали комбинацию двух методов, опираясь на технологию обучения с подкреплением. Они использовали идею о том, что локальный планировщик может генерировать траекторию между двумя близкими состояниями, но плохо подходит для точного построения длинной траектории.

Алгоритм POLAMP строит путь из начальной точки в конечную за один шаг планирования, а для предотвращения столкновения с движущимися препятствиями использует обучаемую локальную стратегию.

«Для обучения агента был предложен набор конфигураций симуляционной среды) в трех типах пространств: пустом, со статическими препятствиями и с динамическими препятствиями. Проведенный эксперимент показал, что трехэтапное расписание обучения демонстрирует лучшие показатели, что особенно важно, когда, например, время обучения, ограничено. Для валидации результатов обучения применялся отдельный набор проверочных карт. Они были заполнены различным количеством динамических препятствий (от 0 до 70), для каждого из которых было сгенерировано пять различных траекторий», - рассказал автор исследования директор Центра когнитивного моделирования МФТИ, ведущий научный сотрудник AIRI Александр Панов.

Проведенные эксперименты показали, что POLAMP превосходит современные базовые алгоритмы (как обучаемые, так и необучаемые), – его коэффициент успешности составил более 92%. POLAMP, например, требовал гораздо меньше примеров для генерации плана движения (при том что объект был обучен только на одном движущемся препятствии).

По словам авторов, следующим важнейшим этапом развития алгоритма POLAMP станет постановка задачи нескольким беспилотным аппаратам, находящимся в одном пространстве. Тогда планирование траектории движения каждого из них будет происходить не только благодаря собственной генерации пути, но и за счет коммуникации между агентами.

Источник