Системный инженер (SRE)/Инженер по надежности инфраструктуры
Маркетспейс · зарплата не указана · Смоленск · HH · опубликовано 27 апреля 2026 г.
Описание вакансии
О компании
«Маркетспейс» — ведущий e-commerce дистрибьютор, который работает с Wildberries, Ozon и Яндекс Маркет. Мы управляем огромными товарными потоками, имеем собственный фулфилмент-центр с площадью складов 35 000 м² и обрабатываем более 40 000 заказов в день. Наш бизнес активно растет, поэтому мы ищем Системный инженер (SRE)/Инженер по надежности инфраструктуры.
Кого ищем
Совмещаем роли SRE + классического системного инженера . Главное — стабильность, инженерный подход к эксплуатации и доступность сервисов.
Зоной ответственности будет: SLA/SLO, инциденты, автоматизация, наблюдаемость, снижение TCO, отказоустойчивость, автоматизация, устранение узких мест.
Вам предстоит, на первом этапе, задокументировать то что есть в компании вместе с текущей командой, затем спроектировать и реализовать серию тех.решений, которые позволят снизить риски потери данных и прерывания бизнеса. Следующий этап, принять активное участие в создании единой внутренней платформы, которая объединит усилия множества небольших команд разработки.
Функциональные обязанности
• Обеспечение надежности, доступности и производительности сервисов.
• Управление инфраструктурой через код (IaC) и автоматизация развертывания.
• Построение и развитие наблюдаемости: логирование, метрики, трассировки.
• Управление инцидентами: реагирование, постмортемы (акты расследования), устранение первопричин.
• Оптимизация инфраструктурных затрат (TCO) и ресурсов.
• Разработка и поддержка единого платформенного сервиса компании (ci/cd, kubernetes, сервис‑мэш, обмены, внутренние api).
• Обеспечение отказоустойчивости и масштабируемости систем.
• Внедрение и контроль SLA/SLO/SLI.
• Совместная работа с разработкой и командами бизнеса для повышения качества релизов.
Требования
Высшее техническое образование.
Понимание и умение работать с инфраструктурой как с кодом: ansible, terraform, helm (можно kustomize), gitops‑подход.
Опыт оркестрации и работы с контейнерами: Docker+Kubernetes.
Практический опыт и понимание, как наладить наблюдаемость и логирование: Prometheus+Grafana.
CI/CD - jenkins или gitlab.
Развитие сетей: mikrotik (или другой опыт работы с VPN, сетевыми экранами, маршрутизаторами).
Опыт (базовый) - по работе с СУБД, очередями: PostgreSQL, Redis, RabbitMQ или Kafka (это будет плюсом).
Значительный плюс - практический опыт перехода с MS SQL на PostgreSQL.
Инструменты: python + bash — для автоматизации и утилит.
Условия
• Удаленная работа,
• иногда могут быть командировки в г. Смоленск.