Reinforcement Learning engineer (Центр Робототехники)
Вакансия № 37557896 в населенном пункте (городе) Москва, Россия от компании "Сбер для экспертов" на сайте Электронный Центр Занятости Населения (ЦЗН) Москвы.
✷ Смотрите другие предложения работы от компании Сбер для экспертов.
Уважаемый соискатель вакансий, Вы можете перейти на сайт прямого работодателя "Сбер для экспертов" для ознакомления с информацией о компании (фирме, организации, ИП). Смотрите Веб-сайт "Сбер для экспертов" - http://www.sberbank-talents.ru
Логотип (торговая марка, бренд, эмблема, внешний вид здания или внутренний интерьер офиса): | ![]() |
Организация работает в следующих сферах деятельности: Финансовый сектор; .
Репутация компании "Сбер для экспертов" в отзывах работников:
Читайте свежие отзывы сотрудников об этой организации на этом сайте.
Оставить мнение об этом работодателе без регистрации бесплатно на этом сайте.
Обязательное требование к опыту работы искомого сотрудника: 3–6 лет.
График работы: полный день.
Тип занятости: полная занятость.
Вакансия № 37557896 добавлена в базу данных: Среда, 10 сентября 2025 года.
Дата обновления этого объявления: Четверг, 25 сентября 2025 года.
Рейтинг вакансии: 3,7 из 100 баллов |
Вакансия № 37557896 прочитана - 6 раз(а)
Отправлено откликов - 0 раз(а)
Вакансии Электронного Центра Занятости Москвы в социальных сетях и мессенджерах:
Работодатель предложит заработную плату по результатам собеседования с соискателем работы.
В Центре Робототехнике мы занимаемся созданием шагающих роботов, роботов-манипуляторов при помощи обучения с подкреплением в рамках проекта по созданию собственного робота общего назначения.
В обязанности работника на вакантом месте входит следующее:
- обучать роботов новым навыкам: ходить, бегать, манипулировать объектами, делать сальто и т.д.
- разрабатывать на PyTorch модели агентов, тренировать их с помощью Reinforcement Learning и/или Imitation Learning, в симуляторе и на реальном железе
- читать научные статьи в поисках путей улучшения текущих алгоритмов применительно к роботам
- интегрировать модели в общий программный стек
- писать документацию, проводить код-ревью, участвовать в планировании исполнения проекта.
Требования к работнику следующие:
- знание различных алгоритмов Reinforcement Learning: PPO, TRPO, A3C и др.
- опыт обучения агентов с помощью (хотя бы одним из методов): Reinforcement Learning, Imitation Learning, Behaviour Cloning, Inverse Reinforcement Learning
- опыт работы с физическими симуляторами: NVIDIA Isaac Sim, MuJoCo
- уверенная разработка на Python: PyTorch, Docker, MLOps, написание тестов, CI/CD
- хорошая подготовка по линейной алгебре
- плюсом будет опыт работы с ROS2.
Условия труда в компании на вакантном месте такие:
- возможность выбрать удобный график – офис или гибрид (локация: г. Москва, Кутузовский проспект к32)
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека для сотрудников выгоднее до 4%
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.
Разместить Ваше резюме сейчас ...
Связаться с автором объявления № 37557896 с предложением работы, размещённого на этой странице:
☎ Показать контактный телефон для связи ...
✉ Показать электронный адрес для связи ...