Компания Nvidiaобъявила о запуске Cosmos Reason AI — новой языковой модели зрения (Vision Language Model, VLM), разработанной для того, чтобы наделить роботов способностью рассуждать, планировать и действовать в реальном мире с пониманием, близким к человеческому.
Главная задача технологии — решить ключевую проблему современной робототехники: большинство существующих систем умеют распознавать объекты, но не справляются со сложными или неоднозначными заданиями, где требуется логика и понимание контекста.
Cosmos Reason AI отличается от традиционных VLM своей способностью использовать предварительные знания, физику и здравый смысл. Модель разбивает сложные инструкции на более простые шаги, адаптируется к новой среде и принимает решения в условиях неопределенности. При этом сама модель достаточно компактна — 7 млрд параметров, а её исходный код открыт для использования.
Три ключевых направления применения Cosmos Reason AI:
Разметка и аннотация данных — автоматизация работы с большими наборами информации для обучения ИИ.
Мозг для роботов — объединение языка, зрения и действий для выполнения сложных команд.
Видеоаналитика — анализ потоков данных для выявления закономерностей и инсайтов.
Интерес к технологии уже проявили такие компании, как Uber, Magna и VAST Data. Cosmos Reason AI планируют использовать в системах для беспилотных автомобилей, роботов-доставщиков и интеллектуального мониторинга.
Дополнительно модель интегрирована в симуляционную платформу Nvidia Omniverse и робототехнический фреймворк Isaac Sim, что расширяет возможности экосистемы и упрощает внедрение решений на базе Cosmos Reason в реальные проекты.
Nvidia уверена: Cosmos Reason станет важным шагом к созданию роботов нового поколения, способных мыслить и действовать более автономно.