Senior Data Engineer
Вакансия № 40291701 в населенном пункте (городе) Москва, Россия от компании "Сбер для экспертов" на сайте Электронный Центр Занятости Населения (ЦЗН) Москвы.
✷ Смотрите другие предложения работы от компании Сбер для экспертов.
Уважаемый соискатель вакансий, Вы можете перейти на сайт прямого работодателя "Сбер для экспертов" для ознакомления с информацией о компании (фирме, организации, ИП). Смотрите Веб-сайт "Сбер для экспертов" - http://www.sberbank-talents.ru
Логотип (торговая марка, бренд, эмблема, внешний вид здания или внутренний интерьер офиса): | ![]() |
Организация работает в следующих сферах деятельности: Финансовый сектор; .
Репутация компании "Сбер для экспертов" в отзывах работников:
Читайте свежие отзывы сотрудников об этой организации на этом сайте.
Оставить мнение об этом работодателе без регистрации бесплатно на этом сайте.
Обязательное требование к опыту работы искомого сотрудника: 3–6 лет.
График работы: график: 5/2 (рабочих часов: 8).
Тип занятости: полная занятость.
Вакансия № 40291701 добавлена в базу данных: Понедельник, 1 сентября 2025 года.
Дата обновления этого объявления: Четверг, 25 сентября 2025 года.
Рейтинг вакансии: 46,67 из 100 баллов |
Вакансия № 40291701 прочитана - 7 раз(а)
Отправлено откликов - 0 раз(а)
Вакансии Электронного ЦЗН Москвы в социальных сетях и мессенджерах:
Работодатель предложит заработную плату по результатам собеседования с соискателем работы.
Строим и масштабируем пайплайны для сбора, обработки и фильтрации огромных мультимодальных датасетов (текст-видео-аудио триплеты, инструкции для редактирования), критически важных для обучения наших моделей.
В обязанности работника на вакантом месте входит следующее:
- разработка ETL/ELT пайплайнов для сбора и предобработки web-scale данных (видео, аудио, текст, метаданные)
- создание инфраструктуры для генерации синтетических инструкций для редактирования изображений/видео и синтетических описаний для изображений/видео/аудио
- обучение и внедрение VLM - based фильтров (e.g., на основе Qwen VL и пр.) для автоматической оценки качества, релевантности и безопасности данных
- построение системы дедупликации, кластеризации и балансировки мультимодальных датасетов
- оптимизация хранения данных на удаленных хранилищах и потоковой передачи данных для ускорения обучения
- масштабирование пайплайнов на распределенных кластерах.
Требования к работнику следующие:
- экспертиза в построении data pipelines (Python, SQL)
- опыт обработки мультимодальных данных (особенно видео/аудио), кодеки, фреймворки (FFmpeg, librosa)
- уверенное применение CV/VLM для фильтрации данных (PyTorch, Hugging Face Transformers)
- опыт работы с распределенными вычислениями (Spark/Ray/Dask) и облачными хранилищами (S3, GCS)
- знание практик data versioning (DVC) и управления метаданными
- навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом.
Условия труда в компании на вакантном месте такие:
- ежегодный пересмотр зарплаты, годовую премию
- корпоративный спортзал и зоны отдыха
- уникальную систему обучения Сбера для профессионального развития
- расширенный ДМС и льготное страхование для семьи
- бесплатную подписку СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера
- корпоративную пенсионную программу.
Разместить Ваше резюме сейчас ...
Связаться с автором объявления № 40291701 с предложением работы, размещённого на этой странице:
☎ Показать контактный телефон для связи ...
✉ Показать электронный адрес для связи ...