Поиск
член отделения член секции член бюро секции
... каждый момент времени. В Курчатовском институте предложили использовать для создания модели импульсной нейронной сети алгоритмы обучения с подкреплением (Reinforcement Learning, RL). При использовании RL-алгоритмов система обучается практически как человек — методом проб и ошибок. Главный ...
... Санкт-Петербургской школы экономики и менеджмента НИУ ВШЭ . Для выполнения расчетов ученые использовали эволюционные алгоритмы и машинное обучение с подкреплением – направления искусственного интеллекта, которые предполагают самообучение компьютерной программы в процессе решения задачи....
... Львовичем Фрадковым и моим научным руководителем д.т.н. Борисом Ростиславичем Андриевским был разработан алгоритм на основе обучения с подкреплением, который «учит» систему управления машины отрабатывать любую заданную скорость в режиме реального времени. При этом больше ...