ИИ обучился сам: система DiscoRL превосходит человеческие алгоритмы

Искусственный интеллект (ИИ) обучается методом проб и ошибок, но изначально требует участия человека для разработки алгоритмов. Однако новые технологии позволяют ИИ обучаться самостоятельно. Исследователи создали систему ИИ, которая разработала собственный алгоритм обучения — DiscoRL, превосходящий человеческие разработки.

В отличие от естественного обучения людей и животных, ИИ обучается целенаправленно, что медленно и трудоёмко. Исследователи использовали эволюционный подход, создав цифровую популяцию агентов. Эти агенты решали задачи в сложных средах, а «метасеть» анализировала их эффективность и изменяла правила обучения. В результате был открыт DiscoRL, который превзошёл предыдущие алгоритмы, включая PPO и MuZero, на играх Atari.

ДискоRL показал лучшие результаты на Atari Benchmark, чем алгоритмы, разработанные людьми, и успешно справлялся с новыми задачами, такими как ProcGen, Crafter и NetHack. Это доказывает, что алгоритмы обучения ИИ могут быть автоматически обнаружены на основе опыта, а не разработаны вручную.

загрузка...

Политика конфиденциальности Пользовательское соглашение

© 2015-2026 Сетевое издание «Фактом». Зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Реестровая запись ЭЛ No ФС 77 - 67652 от 10.11.2016.