Разработчик ML/LLM
Ри-Адванс · зарплата не указана · Москва · HH · опубликовано 10 апреля 2026 г.
Описание вакансии
Мы ищем разработчика, который поможет нам автоматизировать создание качественных изображений. Ваша задача — построить систему пакетной обработки/генерации изображений.
Что предстоит делать:
• развернуть и поддерживать локальную AI‑инфраструктуру для генерации изображений;
• настраивать и оптимизировать пайплайны на базе ComfyUI / Stable Diffusion / ControlNet / SDXL / Flux / SD3 для пакетной обработки изображений;
• обучать собственные чекпоинты и дорабатывать существующие модели под специфику продукта — чтобы сохранять форму объекта, получать чистый фон и единый стиль изображений;
• настраивать масштабирование (multi-worker / multi-GPU);
• экспериментировать с разными моделями генерации (SDXL, Flux, SD3 и др.), чтобы найти оптимальное соотношение качества и скорости;
• развивать DevOps‑pipeline для ML/LLM‑сервисов: настраивать CI/CD, управлять версиями моделей и конфигураций, обеспечивать безопасные релизы, проводить A/B‑тесты и быстрый rollback;
• настроить систему мониторинга нагрузки на GPU, времени генерации и ошибок (например, с помощью Prometheus + Grafana);
• организовать систему очередей задач генерации и балансировку нагрузки между узлами;
• взаимодействовать с бэкенд для интеграции ML‑решений в API‑сервисы (работа с FastAPI, очередями и кэшированием);
• использовать OpenCV и PIL / Pillow для предобработки входных изображений (вырезание фона, выравнивание, нормализация) и постобработки сгенерированных;
• оптимизировать скорость генерации с помощью TensorRT для ускорения инференса на GPU;
• организовать хранение исходных и сгенерированных изображений,
а также чекпоинтов моделей в S3‑совместимых хранилищах.
Чего мы ждём от вас:
• уверенные знания Python(asyncio, aiohttp/FastAPI), PyTorch;
• глубокий опыт работы с ComfyUI на продакшн‑уровне;
• хорошее понимание микросервисной архитектуры и event‑driven подхода;
• понимание принципов работы diffusion‑моделей и методов fine‑tuning;
• опыт обучения собственных чекпоинтов для моделей SDXL / SD 1.5 / Flux / SD3 или аналогичных;
• опыт самостоятельного обучения LoRA, DreamBooth, Textual Inversion;
• умение добиваться консистентности между разными генерациями (сохранять ключевые признаки объекта);
• опыт работы с инструментами управления композицией — ControlNet, IP‑Adapter, StyleAdapter;
• опыт использования OpenCV или PIL/Pillow для обработки изображений;
• знакомство с TensorRT или другими инструментами оптимизации инференса для ускорения генерации;
• опыт работы с S3‑совместимыми хранилищами;
• понимание принципов построения REST API и интеграции с бэкендом;
• опыт работы с PostgreSQL (оптимизация сложных запросов, проектирование схем);
• опыт развёртывания и поддержки локальной AI‑инфраструктуры, включая:
• работу с GPU‑серверами (NVIDIA, CUDA) и оптимизацию использования ресурсов;
• работу с Docker и Docker Compose;
• навыки оркестрации контейнеров (Kubernetes — будет плюсом);
• понимание принципов мониторинга ML‑систем (Prometheus, Grafana или аналоги);
• навыки работы с Redis (кэширование, сессии, очереди);
• опыт построения отказоустойчивых систем и организации резервного копирования.
Что мы предлагаем:
• работа с высоконагруженной системой генерации изображений;
• возможность экспериментировать с самыми свежими моделями и архитектурами;
• минимум бюрократии — вы сможете сосредоточиться на решении интересных задач;
• шанс внести вклад в создание заметного и инновационного продукта.