Системный архитектор
ЧК «SHAI Ltd.» · зарплата не указана · Астана · HH · опубликовано 28 апреля 2026 г.
Описание вакансии
О компании:
SHAI.PRO — казахстанская AI-компания, создающая интеллектуальных агентов и GenAI-платформы для крупных организаций.
Наша цель — стать ключевым AI-игроком в регионе и экспортировать AI-продукты за пределы Казахстана.
О роли:
Нужен системный архитектор, который будет отвечать за проектирование технической платформы, взаимодействие между сервисами и стандарты разработки.
Формат: offline
Город: Астана
Задачи:
• Проекты, доведённые до продакшена под реальной нагрузкой
• Эволюция архитектуры: разделение монолита, миграция БД без даунтайма, смена облака или оркестратора
• Влияние на стандарты команды: ревью, ADR/RFC, менторство
• Принятие trade-off решений на основе метрик
• Проектирование архитектуры новых AI-продуктов, развитие существующих, решение технических вопросов между командами, поддержание производительности и наблюдаемости платформы.
Требования:
• Опыт от 5+ лет в разработке ПО
• Не менее 4 лет как разработчик на продуктовых проектах с реальной нагрузкой: асинхронный код, проектирование схем БД, поддержка сервисов в продакшене, отладка проблем с производительностью, утечки памяти, race conditions, дедлоки.
• Не менее 2 лет как системный/solution-архитектор или техлид с ответственностью за архитектуру продукта: проектирование систем с нуля, выбор стека, защита технических решений.
Технические компетенции
Проектирование систем:
• Микросервисная и событийно-ориентированная архитектура (Saga, CQRS, Outbox). API-дизайн: REST, gRPC, GraphQL — версионирование, обратная совместимость, идемпотентность.
• Брокеры сообщений: Kafka, RabbitMQ, NATS.
Базы данных: PostgreSQL, Redis, MongoDB, ClickHouse — индексы, шардирование, репликация.
• Кэширование и инвалидация.
• Распределённые системы:
• CAP, eventual consistency, идемпотентность.
• Распределённые транзакции, компенсирующие операции.
• Отказоустойчивость: circuit breaker, retry с backoff, bulkhead, graceful degradation. Профилирование и нагрузочное тестирование.
Инфраструктура:
• Docker, Docker Swarm/Kubernetes. CI/CD: blue-green и canary-деплой. Observability: логирование, метрики (Prometheus), трейсинг (OpenTelemetry, Jaeger). Безопасность: OAuth2, JWT, mTLS, OWASP Top 10.
ML-инфраструктура:
• Serving моделей (Triton, TorchServe, vLLM), батчинг, GPU-планирование. Версионирование моделей, A/B-тесты, мониторинг drift. LLM: оркестрация агентов, RAG, vector-БД (Qdrant, Weaviate, pgvector), управление контекстом и токен-бюджетом.
Стек:
• Python (основной), Go и Rust (для критичных по производительности модулей), Next.js/React, Docker Swarm, ML-модели в продакшене.
• Глубокая экспертиза по всему стеку не обязательна — важнее архитектурное мышление. Python и контейнеризация — базовое требование.
Условия:
• Работа над реальными AI-продуктами, а не прототипами
• Быстрые итерации и живые клиенты
• Минимум бюрократии
• Прямая коммуникация с технической командой
• Возможность профессионального роста