Малые нейросети адаптировали для ускорения разработки машинного зрения

Подобные алгоритмы критически важны для предсказания и планирования пути движения беспилотных автомобилей или дронов, однако их работе часто мешает то, что отслеживаемые объекты не полностью видны на снимках или их сложно различить на зашумленных изображениях, получаемых лидарами

Исследователи из России разработали подход, который позволяет использовать малые нейросети для ускоренного обучения более сложно устроенных систем ИИ, предназначенных для распознавания трехмерного положения предметов на снимках с лидаров (лазерных радаров). Об этом в пятницу сообщила пресс-служба Института искусственного интеллекта AIRI.

«Мы начали работу над проектом параллельно с исследователями OpenAI, которые решили применить схожий подход для работы с текстами, тогда как наша команда сосредоточилась на компьютерном зрении. Интересно, что и сама идея, и полученные результаты показали свою состоятельность у обеих команд, которые пришли к схожим выводам не взаимодействуя друг с другом напрямую», - заявил руководитель группы "ИИ в промышленности" института AIRI Илья Макаров, чьи слова приводит пресс-служба института.

Исследователи разработали небольшую нейросеть, которая позволяет решить одну из главных проблем при разработке и обучении крупных систем ИИ, способных распознавать объекты и оценивать их положение в трехмерном пространстве. Подобные алгоритмы критически важны для предсказания и планирования пути движения беспилотных автомобилей или дронов, однако их работе часто мешает то, что отслеживаемые объекты не полностью видны на снимках или их сложно различить на зашумленных изображениях, получаемых лидарами.

И то, и другое, как отмечают исследователи, значительным образом осложняет и замедляет процесс обучения нейросетей, способных определять положение объектов в пространстве. Российские ученые предположили, что данную проблему можно решить, если предварительно обработать набор снимков, используемых для обучения, при помощи малой нейросети, способной удалять шум и "достраивать" изображения объектов с учетом того, как они выглядят на других кадрах.

Руководствуясь этой идеей, исследователи обучали небольшую генеративную нейросеть на доступных записях снимков с лидара, снятых во время проезда автомобиля по улицам города. Затем эта небольшая, но точная модель была использована для обучения большой нейросети, работающей на шумных снимках с множеством сложных параметров. Малая нейросеть значительно повысила точность распознавания реальных объектов - технология стала корректно предполагать форму окружающих предметов, которые могла увидеть лишь в будущем.

Подобные улучшения должны значительным образом повысить качество и безопасность работы систем навигации беспилотных автомобилей и дронов. Кроме того, схожим образом, как предполагают ученые, можно использовать малые нейросети для ускоренного обучения и разработки других сложно устроенных систем ИИ, а также создания нейросетевых "учителей", способных ускорять обучение сразу нескольких типов других алгоритмов.

Источник