Reinforcement Learning engineer (Центр Робототехники)

Вакансия № 37557896 в населенном пункте (городе) Москва, Россия от компании "Сбер для экспертов" на сайте Электронный Центр Занятости Населения (ЦЗН) Москвы.

✷ Смотрите другие предложения работы от компании Сбер для экспертов.

Уважаемый соискатель вакансий, Вы можете перейти на сайт прямого работодателя "Сбер для экспертов" для ознакомления с информацией о компании (фирме, организации, ИП). Смотрите Веб-сайт "Сбер для экспертов" - http://www.sberbank-talents.ru

Логотип (торговая марка, бренд, эмблема, внешний вид здания или внутренний интерьер офиса):

Логотип (торговая марка, бренд, эмблема) Сбер для экспертов

Организация работает в следующих сферах деятельности: Финансовый сектор; .

Репутация компании "Сбер для экспертов" в отзывах работников:

Читайте свежие отзывы сотрудников об этой организации на этом сайте.

Оставить мнение об этом работодателе без регистрации бесплатно на этом сайте.

Обязательное требование к опыту работы искомого сотрудника: 3–6 лет.

График работы: полный день.

Тип занятости: полная занятость.

Вакансия № 37557896 добавлена в базу данных: Среда, 10 сентября 2025 года.

Дата обновления этого объявления: Четверг, 25 сентября 2025 года.

Рейтинг вакансии: 3,7 из 100 баллов

Вакансия № 37557896 прочитана - 6 раз(а)
Отправлено откликов - 0 раз(а)

Вакансии Электронного Центра Занятости Москвы в социальных сетях и мессенджерах:

Работодатель предложит заработную плату по результатам собеседования с соискателем работы.

В Центре Робототехнике мы занимаемся созданием шагающих роботов, роботов-манипуляторов при помощи обучения с подкреплением в рамках проекта по созданию собственного робота общего назначения.

В обязанности работника на вакантом месте входит следующее:

обучать роботов новым навыкам: ходить, бегать, манипулировать объектами, делать сальто и т.д.
разрабатывать на PyTorch модели агентов, тренировать их с помощью Reinforcement Learning и/или Imitation Learning, в симуляторе и на реальном железе
читать научные статьи в поисках путей улучшения текущих алгоритмов применительно к роботам
интегрировать модели в общий программный стек
писать документацию, проводить код-ревью, участвовать в планировании исполнения проекта.

Требования к работнику следующие:

знание различных алгоритмов Reinforcement Learning: PPO, TRPO, A3C и др.
опыт обучения агентов с помощью (хотя бы одним из методов): Reinforcement Learning, Imitation Learning, Behaviour Cloning, Inverse Reinforcement Learning
опыт работы с физическими симуляторами: NVIDIA Isaac Sim, MuJoCo
уверенная разработка на Python: PyTorch, Docker, MLOps, написание тестов, CI/CD
хорошая подготовка по линейной алгебре
плюсом будет опыт работы с ROS2.

Условия труда в компании на вакантном месте такие:

возможность выбрать удобный график – офис или гибрид (локация: г. Москва, Кутузовский проспект к32)
ежегодный пересмотр зарплаты и годовая премия
корпоративный спортзал и зоны отдыха
более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
ипотека для сотрудников выгоднее до 4%
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.

Разместить Ваше резюме сейчас ...

Связаться с автором объявления № 37557896 с предложением работы, размещённого на этой странице:

☎ Показать контактный телефон для связи ...

✉ Показать электронный адрес для связи ...

Написать в компанию ...

✉ Отправить резюме в организацию ...

☎ Позвонить работодателю ...