Conditioning of Reinforcement Learning Agentsand its Policy Regularization Application - видео




Ролик записан к постеру на конференции ICML 2020 Bias and Generalization in RL Workshop. Спикер Арип Асадулаев научный сотрудник и аспирант лаборатории машинного обучения ИТМО. В презентации дано краткое описание проблемы обусловленности матрицы Якобиана агентов обучения с подкреплением а также представлены результаты применения техник регуляризации обусловленности для ряда задач. Ссылка на полную статью Conditioning of Reinforcement Learning Agents and its Policy Regularization Application...
Источник видео: RuTube.ru (Обучение)



Ваше мнение о видео
Комментарии ( 0 )

Сначала новые
Сначала старые
Сначала лучшие

Впишите НИК/Имя что бы писать комментарии

Войти

Похожее видео

#
Сегодня обсуждают

  1. Спасибо Дарина. Замечательный расклад! Действительно очень много информации и есть над чем подумать. Постоянно убеждаюсь, что советы вселенной даются не просто так, учат нас мудрости. Благодарю за вашу работу!!!



    Ребята, захватывающая у вас жизнь и упорства море. Меня бы накрыло отчаянье если б в первой яме ничегошеньки стоящего не было. Я конечно приверженец легальной археологи, с научными открытиями и т.д. Но, будем смотреть правде в глаза, если б не ч...


    Мартышка местечковая. Все лезут к русским деньги заколачивать, а заодно и жизни "научить". Паршивая овца.