AI/QA-инженер
Rubytech · зарплата не указана · Москва · HH · опубликовано 27 мая 2026 г.
Описание вакансии
Группа Rubytech — лидирующий производитель программно-аппаратных комплексов и разработчик технологий для высоконагруженных ИТ-инфраструктур. Мы выпускаем собственную линейку ПАК Скала^р, а также строим и защищаем от киберугроз инфраструктуру, обеспечивая бесперебойную работу крупного бизнеса и государственных организаций.
Вам предстоит:
Тестирования AI/ML-компонентов и сервисов; Проверка качества моделей и корректности вывода; Работа с фреймворками: LangChain, LlamaIndex, RAGAS, Langfuse; Тестирование агентских систем: проверка циклов (отсутствие зацикливания), корректность вызова инструментов, graceful degradation при ошибках; Настраивать тестовые датасеты с разнообразными сценариями (включая edge cases: сленг, опечатки, отрицания, длинные контексты); Создавать и поддерживать золотых датасетов (golden answers) для автоматической сверки; Вести тест-кейсы и чек-листы для регрессионного тестирования при смене модели или промпта; Тестировать RAG-пайплайны: качество retrieval (Hit Rate, MRR, NDCG@K), релевантность ответов, groundedness; A/B-тестирование промптов и моделей (включая сравнение разных LLM); Нагрузочное тестирование LLM-сервисов: измерение TTFT (time to first token), TPOT (time per output token), latency, throughput (инструменты: Locust, k6); Версионирование тестовых данных и датасетов (DVC или аналоги) для воспроизводимости тестов; CI/CD для ML: автоматический запуск тестов при изменении промпта, модели или коннектора; Мониторинг качества в продуктивном контуре: отслеживание дрифта метрик, аномалий в ответах, деградации retrieval. Требования к нашему кандидату:
Опыт тестирования AI/ML-компонентов и сервисов; Опыт работы с фреймворками: LangChain, LlamaIndex, RAGAS, Langfuse; Опыт тестирования RAG-пайплайнов: качество retrieval (Hit Rate, MRR, NDCG@K), релевантность ответов, groundedness; Знание Python, SQL, REST API; Знание метрик оценки LLM; Понимание принципов работы агентских систем, MCP. Желательно:
Опыт работы с Postman, Selenium, PyTest; Оценка экономической эффективности: контроль token usage, cost per request, API-лимитов; Понимание интеграционного тестирования: коннекторы к Active Directory, MS SharePoint, Confluence, мессенджерам и пр.; Навыки тестирования ИБ: prompt injection, jailbreak-атаки, проверка утечки PII (паспорта, телефоны), data leakage системных промптов. Что мы предлагаем:
Уютный, комфортный и современный офис в пешей доступности от м. Алексеевская, где есть все необходимое для работы и даже больше: дежурный врач, кафе и столовая, кофе и фрукты, фитнес-центр, коворкинг и многое другое. Стабильный и «белый» конкурентный доход, который мы обсудим при встрече; Удобный график — гибрид или офис (в зависимости от подразделения); Работа в аккредитованной ИТ-компании из реестра Минцифры (отсрочка от мобилизации); Профессиональный рост, обучение и развитие, участие в проекте «Лекторий Rubytech»; Развитые спортивные комьюнити: футбол, волейбол, баскетбол и шахматы; ДМС для вас и вашей семьи на особых условиях; Тимбилдинги, митапы и другие корпоративные мероприятия; Скидки у 500+ партнеров (платформы BestBenefits и Lerna).
Ждем вас в нашей команде!