Все вакансии

DevOps/MLOps инженер

Росгосстрах · зарплата не указана · Москва · HH · опубликовано 27 апреля 2026 г.

Компания Росгосстрах
Источник HH
Опубликовано 27 апреля 2026 г.
Зарплата зарплата не указана

Описание вакансии

Технологический стек:
• Docker, Kubernetes.
• Kserve/Seldon Core /Triton/vllm.
• AirFlow, GitLab CI.
• MLFlow.
• PostgreSQL, Minio(S3).
Чем предстоит заниматься:
• Управление Kubernetes-инфраструктурой:
Разворачивание, сопровождение и оптимизация production-окружений на базе Kubernetes.
Настройка и обслуживание GPU-нод для эффективной работы тренировочных задач и инференса тяжелых LLM-моделей.
Разработка и поддержка Helm Charts для унификации деплоя микросервисов и ML-компонентов.
• Автоматизация CI/CD для ML:
Проектирование и поддержка пайплайнов автоматической сборки, тестирования и деплоя (CI/CD) в GitLab CI.
Построение процессов непрерывной доставки моделей (CD для ML): от регистрации артефакта до развертывания в прод.
• Оркестрация данных и экспериментов:
Обеспечение стабильной работы Apache AirFlow для orchestration DAG-ов (пайплайнов подготовки данных, тренировок и валидации).
Администрирование и интеграция MLFlow (отслеживание экспериментов, реестр моделей, переход между версиями моделей).
• Инференс и продуктивизация моделей:
Развертывание и настройка высокопроизводительных inference-серверов: KServe / Seldon Core (для стандартного ML), а также Triton и vLLM (для LLM и генеративных моделей).
Внедрение лучших практик по масштабированию (autoscaling), канареечным развертываниям (canary) и мониторингу дрифта данных.
• Работа с данными и хранилищами:
Настройка и поддержка взаимодействия между компонентами и системами хранения: PostgreSQL (как бэкенд для AirFlow/MLFlow) и объектное хранилище Minio (S3) (для хранения датасетов, артефактов моделей и чекпоинтов).
• Разработка и код:
Написание вспомогательных утилит и адаптеров для интеграции ML-библиотек с инфраструктурой.
Будет плюсом, если вы готовы писать высоконагруженные компоненты на Go.
Мы ожидаем от кандидата:
• Опыт работы на релевантной позиции от 2-х лет;
• Опыт развертывания, настройки и поддержки Kubernetes окружения в production среде;
• Опыт развертывания, настройки и поддержки релевантного стека (AirFlow, GitLab CI, MLFlow, PostgreSQL, Minio(S3));
• Опыт настройки CI/DC пайплайнов (GitLab CI/CD);
• Опыт настройки GPU нод в Kubernetes;
• Опыт развертывания, настройки и поддержки inference серверов, таких как Kserve / Seldon Code в в production среде;
• Опыт продуктивизации ML/LLM моделей;
• Опыт разработки/ написание helm chart-в;
• Знание Python (Знание Go приветствуется).
Мы предлагаем:
• Профессиональное развитие в команде экспертов, нетривиальные задачи, новый интересный опыт;
• Возможность работать в составе крупной компании, лидере страхового рынка;
• Полное соблюдение норм Трудового Кодекса РФ;
• Полностью "белая" конкурентная зарплата, премии;
• График работы 5/2 (удаленный формат работы) или гибридный график с офисом ст .м. Киевская ;
• Корпоративные скидки на страховые продукты (авто страхование, ВЗР и т.д.);
• Корпоративные скидки на фитнес, магазины-партнёры, книги и др.;
• Подключение к ДМС после успешного прохождения испытательного срока;
• Электронная библиотека с более чем 3000 книг на самые актуальные темы.

Навыки

  • Python
  • Prometheus
  • Docker
  • PostgreSQL
  • Kubernetes
  • Kafka
  • Terraform
  • MLflow
  • GitLab CI
Открыть вакансию в ленте