LLM-инженер
Вакансия № 39647354 в населенном пункте (городе) Москва, Россия от компании "ООО ДЮК Технологии" на сайте Электронный Центр Занятости Населения (ЦЗН) Москвы.
✷ Смотрите другие предложения работы от компании ООО ДЮК Технологии.
Логотип (торговая марка, бренд, эмблема, внешний вид здания или внутренний интерьер офиса): | ![]() |
Репутация компании "ООО ДЮК Технологии" в отзывах работников:
Читайте свежие отзывы сотрудников об этой организации на этом сайте.
Оставить мнение об этом работодателе без регистрации бесплатно на этом сайте.
Обязательное требование к опыту работы искомого сотрудника: 1–3 года.
График работы: график: 5/2 (рабочих часов: 8).
Тип занятости: полная занятость.
Вакансия № 39647354 добавлена в базу данных: Среда, 10 сентября 2025 года.
Дата обновления этого объявления: Пятница, 26 сентября 2025 года.
Рейтинг вакансии: 1,96 из 100 баллов |
Вакансия № 39647354 прочитана - 1 раз(а)
Отправлено откликов - 0 раз(а)
Вакансии ЦЗН Москвы в соцсетях и мессенджерах:
Работодатель предложит заработную плату по результатам собеседования с соискателем работы.
DUC Technologies – это быстроразвивающаяся консалтинговая компания в сфере IT, специализирующаяся на решениях в области управления данными, AI и прикладной Python-разработки.
Мы уже более 3 лет на рынке IT и за это время зарекомендовали себя как надежный партнер и работодатель.
Наша команда экспертов в сфере Big Data успешно работает в формате удаленного it-отдела. И будет рада принять тебя в теплую атмосферу нашей команды. Мы уважаем дисциплинированных, активных, ответственных и неординарных сотрудников.
В обязанности работника на вакантом месте входит следующее:
- Разработка и настройка чат-ботов и ассистентов, включая реализацию цепочек вызовов, механизмов памяти и fallback.
- Построение систем Retrieval-Augmented Generation (RAG): от разбиения данных на чанки до поиска релевантных результатов.
- Оптимизация затрат на вызовы LLM, работа с механизмами streaming и function calling.
- Интеграция API сторонних LLM (OpenAI, Claude, DeepSeek) и адаптация промптов под задачи.
- Работа с векторными хранилищами (FAISS, Pinecone) и графами знаний.
- Создание прототипов MVP интерфейсов для демонстрации функционала (HTMX/Bootstrap/Streamlit).
- Настройка инфраструктуры для LLM: подключение API, конфигурирование кэшей и систем очередей.
- Применение методов квантования моделей и организация fallback на локальные версии GPT.
- Мониторинг ключевых метрик и ведение логов работы систем.
- Работы с low code редакторами и настройка пайплайнов работы с LLM.
Требования к работнику следующие:
- Продвинутое владение Python: опыт работы с asyncio, threading, multiprocessing, профилированием задач, чувствительных к памяти/CPU.
- Уверенное использование FastAPI в сочетании с Pydantic v2 для построения асинхронной архитектуры.
- Опыт проектирования схем данных, настройки индексов и работы с СУБД: PostgreSQL, Redis, MongoDB.
- Знание принципов контейнеризации: Docker, Docker Compose; базовое понимание Kubernetes.
- Способность оперативно создавать рабочие MVP в сжатые сроки.
- Умение самостоятельно определять задачи и подбирать оптимальные архитектурные решения.
- Опыт взаимодействия с любыми API LLM
Будет плюсом:
- Навыки быстрого прототипирования пользовательских интерфейсов (HTMX/Bootstrap/Streamlit).
- Знания в области построения RAG-систем: выбор подходящих векторных БД и графов знаний.
- Практический опыт настройки систем очередей сообщений: RabbitMQ, Kafka; работа с Celery — реализация retry-логики, dead-letter очередей.
- Опыт работы с vLLM;
- Опыт работы с провайдером ollama и библиотеками llamaindex, langchain, mcp, a2a;
- Опыт разбиения на чанки и оптимизация точности LLM-моделей;
- Опыт fine-tuning LLM моделей.

- ??????????????Удаленный формат работы;
- Работа в аккредитованной IT компании;
- Гибкий график работы 5/2, с 9.00- 18.00 или другой по согласованию (суббота, воскресенье и праздничные - выходные)
Разместить Ваше резюме сейчас ...
Связаться с автором объявления № 39647354 с предложением работы, размещённого на этой странице:
☎ Показать контактный телефон для связи ...
✉ Показать электронный адрес для связи ...