«Для обучения агента был предложен набор конфигураций симуляционной среды) в трех типах пространств: пустом, со статическими препятствиями и с динамическими препятствиями. Проведенный эксперимент показал, что трехэтапное расписание обучения демонстрирует лучшие показатели, что особенно важно, когда, например, время обучения, ограничено. Для валидации результатов обучения применялся отдельный набор проверочных карт. Они были заполнены различным количеством динамических препятствий (от 0 до 70), для каждого из которых было сгенерировано пять различных траекторий», - рассказал автор исследования директор Центра когнитивного моделирования МФТИ, ведущий научный сотрудник AIRI Александр Панов.