NLP Engineer (GigaChat)
Вакансия № 40400586 в населенном пункте (городе) Москва, Россия от компании "Сбер для экспертов" на сайте Электронный Центр Занятости Населения (ЦЗН) Москвы.
✷ Смотрите другие предложения работы от компании Сбер для экспертов.
Уважаемый соискатель вакансий, Вы можете перейти на сайт прямого работодателя "Сбер для экспертов" для ознакомления с информацией о компании (фирме, организации, ИП). Смотрите Веб-сайт "Сбер для экспертов" - http://www.sberbank-talents.ru
Логотип (торговая марка, бренд, эмблема, внешний вид здания или внутренний интерьер офиса): | ![]() |
Организация работает в следующих сферах деятельности: Финансовый сектор; .
Репутация компании "Сбер для экспертов" в отзывах работников:
Читайте свежие отзывы сотрудников об этой организации на этом сайте.
Оставить мнение об этом работодателе без регистрации бесплатно на этом сайте.
Обязательное требование к опыту работы искомого сотрудника: 3–6 лет.
График работы: график: 5/2 (рабочих часов: 8).
Тип занятости: полная занятость.
Вакансия № 40400586 добавлена в базу данных: Пятница, 5 сентября 2025 года.
Дата обновления этого объявления: Четверг, 25 сентября 2025 года.
Рейтинг вакансии: 53,85 из 100 баллов |
Вакансия № 40400586 прочитана - 4 раз(а)
Отправлено откликов - 0 раз(а)
Вакансии Электронного Центра Занятости Населения Москвы в социальных сетях и мессенджерах:
Работодатель предложит заработную плату по результатам собеседования с соискателем работы.
Мы - команда GigaChat Pretrain Data, готовим pretrain данные для GigaChat и GigaChat Vision. Данных много. Очень много (40+ Пб сырого хаоса). Если хочется не просто тренировать модели, а работать с реально большими данными, то вот твой шанс :)
В обязанности работника на вакантом месте входит следующее:
- чистить данные по узким доменам (аниме, игры, сериалы, книги, фильмы) ? LLM-парсинг + Code Execution Feedback
- делать пайплайны для экспериментов (модели 400M – 32B), всё красиво в wandb
- фильтровать данные так, чтобы метрики росли
- доставать из книг задачи по математике ? сиды для синтетики
- генерить синтетические данные ? на тысячах GPU
- разбираться с токенизацией ? сколько букв "r" в "strawberry"?
- кластеризовать данные ? чистим данные от мусора, прежде чем модель начнёт верить в астрологию
- писать дедупликацию на Rust ? миллиарды документов, но не за O(n?)
- оптимизировать MapReduce ? Spark, тысячи ядер (опыт с YTsaurus - плюс)
- экспериментировать с SFT и RL ? DPO, DRPO, увеличиваем качество синтетики.
Требования к работнику следующие:
- выпускник ШАД/ ВШЭ Факультета компьютерных наук/ МФТИ Факультета инноваций и высоких технологий и/или имеешь коммерческий релевантный опыт в роли NLP Engineer от двух лет.
Условия труда в компании на вакантном месте такие:
- комфортный современный офис рядом с м. Кутузовская
- гибридный формат работы (2 дня в офисе, 3 дня на удалёнке)
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- система обучения для профессионального и карьерного развития
- расширенный полис ДМС с первого дня работы и страхование для семьи
- льготная программа ипотеки для сотрудников
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.
Разместить Ваше резюме сейчас ...
Связаться с автором объявления № 40400586 с предложением работы, размещённого на этой странице:
☎ Показать контактный телефон для связи ...
✉ Показать электронный адрес для связи ...