NLP разработчик
Вакансия № 38528317 в населенном пункте (городе) Москва, Россия от компании "ООО Транснефть-Технологии" на сайте Электронный Центр Занятости Населения (ЦЗН) Москвы.
✷ Смотрите другие предложения работы от компании ООО Транснефть-Технологии.
Логотип (торговая марка, бренд, эмблема, внешний вид здания или внутренний интерьер офиса): | ![]() |
Организация работает в следующих сферах деятельности: Информационные технологии, системная интеграция, интернет; Нефть и газ; .
Репутация компании "ООО Транснефть-Технологии" в отзывах работников:
Читайте свежие отзывы сотрудников об этой организации на этом сайте.
Оставить мнение об этом работодателе без регистрации бесплатно на этом сайте.
Обязательное требование к опыту работы искомого сотрудника: 3–6 лет.
График работы: график: 5/2 (рабочих часов: 8).
Тип занятости: полная занятость.
Вакансия № 38528317 добавлена в базу данных: Понедельник, 8 сентября 2025 года.
Дата обновления этого объявления: Пятница, 26 сентября 2025 года.
Рейтинг вакансии: 12,5 из 100 баллов |
Вакансия № 38528317 прочитана - 14 раз(а)
Отправлено откликов - 0 раз(а)
Вакансии Центра Занятости Населения Москвы в социальных сетях и мессенджерах:
Адрес вакантного места работы: Москва, 3-я Песчаная улица, 2А.
Работодатель предложит заработную плату по результатам собеседования с соискателем работы.
Транснефть-Технологии оказывает IT-услуги организациям системы «Транснефть» в области внедрения, технической эксплуатации и сопровождения корпоративных информационных систем и IT-инфраструктуры.
Приглашаем опытного ML разработчика в нашу команду.
Чем предстоит заниматься:
- Рефакторинг и внедрение версионирования данных с метриками;
- Формирование векторного и полнотекстового поиска;
- Объединение результатов векторного и полнотекстового поиска по базе данных;
- Формирование графовой БД;
- Промпт-инжиниринг;
- Кэширование данных;
- Определение loss-функций под метрики ранжирования контекстов на синтетическом наборе данных с random negative sampling;
- Формирование подхода чтения таблиц и списков в документах для помещения этих данных в граф знаний, а также определение мпособа их форматирования для последующей передачи в промпт для LLM;
- Внедрение автоматической метрик METEOR, BLEURT, ROUGE для оценки качества ответов на основе сравнения с эталонными (референсными) ответами;
- Двухкомпонентная валидация данных;
- Создание бенчмарка Close-Domain QA;
- Исследовать применяемые методы оценки (scorers) на наличие там батчинга/асинхронки;
- Генерация с помощью имеющейся LLM синтетических запросов;
- Аугментация набора данных, путём извлечения из оригинальных документов предложений и добавлению их в набор данных в качестве запроса к соответствующему документу (sentence cropping);
- Использование дополнительной модели-ранжировщика (re-ranker) для получения новых комбинаций документов с подходящими и неподходящими к ним запросов (Knowledge distillation, GPL);
- Использование нескольких типов моделей-ранжировщиков для разностороннего обучения ретривера (DRAGON+).
Ожидаем от Вас:
- Наличие успешно реализованных проектов в направлении NLP, возможность продемонстрировать код;
- Умение определять требуемую архитектуру для разработки, обучения и эксплуатации моделей;
- Понимание и опыт практического применения алгоритмов машинного обучения (pytorch, sklearn, xgboost и др.);
- проработали от 2 лет в области создания программного обеспечения в роли python-разработчика, из них от 1 года в области ML-решений;
- используете Docker, Git в повседневной работе;
- работали c инструментами оркестрации процессов (Airflow, Prefeсt, Kubeflow, MLFlow);
- работали с инструментами для управления версиями моделей и данных - DVC;
- Опыт работы с REST API для интеграции моделей машинного обучения.
Мы предлагаем:
- Возможность работать над сложными и значимыми проектами;
- Программы обучения и повышения квалификации за счет компании;
- Широкий социальный пакет: ДМС со стоматологией, компенсация спорта, компенсация санаторно-курортного лечения и отдыха и др.;
- Премии ко Дню нефтяника и к отпуску;
- График работы: 5/2 с 09.00 до 18.00; пятница: до 16.45;
- Гибридный формат работы в офисах в Москве, Самаре и Иркутске или возможность дистанционной работы в других городах.
Разместить Ваше резюме сейчас ...
Связаться с автором объявления № 38528317 с предложением работы, размещённого на этой странице:
☎ Показать контактный телефон для связи ...
✉ Показать электронный адрес для связи ...