Conditioning of Reinforcement Learning Agentsand its Policy Regularization Application - видео
Ролик записан к постеру на конференции ICML 2020 Bias and Generalization in RL Workshop.
Спикер Арип Асадулаев научный сотрудник и аспирант лаборатории машинного обучения ИТМО.
В презентации дано краткое описание проблемы обусловленности матрицы Якобиана агентов обучения с подкреплением а также представлены результаты применения техник регуляризации обусловленности для ряда задач.
Ссылка на полную статью Conditioning of Reinforcement Learning Agents and its Policy Regularization Application...
Источник видео: RuTube.ru (Обучение)
Супер !!! Я в шоке
Спасибо Дарина. Замечательный расклад! Действительно очень много информации и есть над чем подумать. Постоянно убеждаюсь, что советы вселенной даются не просто так, учат нас мудрости. Благодарю за вашу работу!!!
Крутой бас
Ребята, захватывающая у вас жизнь и упорства море. Меня бы накрыло отчаянье если б в первой яме ничегошеньки стоящего не было. Я конечно приверженец легальной археологи, с научными открытиями и т.д. Но, будем смотреть правде в глаза, если б не ч...
Мартышка местечковая. Все лезут к русским деньги заколачивать, а заодно и жизни "научить". Паршивая овца.