«Это самый важный этап жизни ИИ-модели, по сути, процесс работы без необходимости дополнительного обучения. Подход кардинально отличается от классического машинного обучения с подкреплением, где мы пытаемся получить просто модель, которая хорошо бы решала какой-то набор задач или делала имитацию эксперта, — рассказывают в AIRI. — Это фундаментальный сдвиг. Такой уход от экспертной имитации в пользу алгоритмической имитации позволяет получать модели со свойствами самокоррекции и самоулучшения, то есть позволяет агенту корректировать свое поведение налету».
«За счет обучения модели сразу в нескольких доменах удалось пойти дальше синтетических условий, в которых применялся ICRL раньше», — говорит он.
«Принятие статей на конференции уровня A*, к которым относится ICML, подчеркивает качество и актуальность российских научных исследований в области машинного обучения. Это не только укрепляет позиции российских ученых на международной арене, но и способствует обмену знаниями и опытом, что, в свою очередь, ускоряет общий прогресс в области ИИ», — сообщили в «Яндексе». На эту конференцию также приняты шесть статей исследователей «Яндекса», посвященных различным аспектам машинного обучения — от алгоритмического мышления нейронных сетей и измерения разнообразия до оптимизации использования памяти при работе с большими языковыми моделями, добавили там.