Мои Уведомления
Привет, !
Мой Аккаунт Мои Финансы Мои Подписки Мои Настройки Выход
Все Вопросы Мои Вопросы

В чем принцип действия имитационного обучении ml agents?

UnityC#

В документации сказано, что даются внутренние награды, когда агент действует схоже записи. Что значит схоже? Явно смысл записи не в том, что бы агент копировал движения игрока, идя по тем же координатам, нельзя записать все возможные случаи на рандомизированный карте, значит схожесть заключается в чём-то другом и за какие действия агенту даются внутренние награды ?(использую Gail)


Комментарии

0
Будьте первым, кто оставит комментарий к этому посту
Гости не могут отвечать на вопросы. Войдите на Сайт или Зарегистрируйтесь