Fullstack-разработчик
Т1 ИИ · зарплата не указана · Екатеринбург · HH · опубликовано 9 июня 2026 г.
Описание вакансии
Вместе с нами тебе предстоит: Разработка и развитие AI-агентов и AI-продуктов.
Построение и улучшение RAG и ML-пайплайнов.
Оптимизация latency, стабильности и стоимости inference.
Внедрение мониторинга качества моделей и сервисов.
Интеграция AI-компонентов в продуктовую архитектуру.
Участие в развитии AI-платформы и инженерных практик.
Какие навыки и знания для нас важны: Коммерческий опыт fullstack-разработки от 5+ лет, из них 2+ лет с активным применением AI (LLM/ML).
Практический опыт разработки и вывода в прод AI-агентов или AI-продуктов.
Понимание архитектуры LLM-приложений (RAG, embeddings, orchestration, tools).
Опыт работы с ML/NLP-пайплайнами в продакшене.
Навыки оптимизации latency и стабильности AI-сервисов.
Уверенные знания backend и frontend разработки.
Работа с multi-agent системами или сложными агентными пайплайнами.
Опыт оптимизации стоимости inference (token usage, caching, batching).
Знание MLOps-практик и CI/CD для ML.
Опыт построения AI-платформ или внутренних AI-инфраструктур.
Глубокое понимание RAG (retrieval quality, chunking, reranking, evaluation).
Опыт мониторинга качества моделей (offline/online метрики, A/B).
Опыт управления коллективом-обязателен от 1 года.
Требования к личным качествам:
Инженерное мышление и ориентация на результат.
Проактивность в улучшении архитектуры и процессов.
Готовность брать ownership за продуктовые куски.
Умение работать в неопределенности и быстро проверять гипотезы.
Коммуникабельность и способность объяснять сложные вещи просто.
Интерес к новым AI-подходам и инструментам.
Знание иностранного языка (уровень): не ниже B1.
Знание стека:
Backend: Python (FastAPI), Node.js (NestJS/Express).
Frontend: React / Next.js.
LLM-стек: open-source модели, LangChain/аналоги.
Базы данных: PostgreSQL, Redis.
Инфраструктура: Docker, Kubernetes, облака.
Профессиональные навыки:
Проектирование и разработка AI-агентов и LLM-приложений.
Построение и оптимизация RAG-пайплайнов.
Интеграция LLM с внешними сервисами и API.
Оптимизация производительности (latency, throughput, cost).
Настройка мониторинга и оценки качества моделей.
Участие в архитектурных решениях и развитии платформы.
Специализированные программы:
LangChain или аналоги.
OpenAI API / HuggingFace / vLLM.
Postman, Swagger.
Prometheus, Grafana (или аналоги для мониторинга).
GitHub / GitLab CI/CD.
Airflow.