DevOps / SRE specialist
Отельлинк · до 200 000 RUB · Санкт-Петербург · HH · опубликовано 24 апреля 2026 г.
Описание вакансии
Привет! Мы — дочерняя IT-компания сети отелей «Друзья».
Сейчас мы в поиске инженера, который возьмёт на себя развитие и поддержку инфраструктуры: от Kubernetes и CI/CD до мониторинга, безопасности и отказоустойчивости.
Инфраструктура уже построена, но её нужно развивать, упрощать и делать надёжнее.
О проекте
• ~25 микросервисов
• Kubernetes-кластер (self-hosted)
• ~50 виртуальных машин + bare-metal
• PostgreSQL (Patroni), MySQL, Redis, RabbitMQ
• ~20 TB бэкапов (S3/MinIO + Proxmox Backup Server)
• CI/CD — self-hosted GitLab
• Частые релизы
• Основной продукт: система управления сетью отелей (PMS)
Стек
• Kubernetes
• Docker / cri-o
• GitLab CI/CD
• HAProxy / Nginx / CrowdSec
• Vault (secrets)
• Prometheus + Alertmanager + Grafana
• ELK stack
• S3 / MinIO
• Proxmox VE + PBS
• Linux (Debian / Talos)
• KeyCloak
Задачи
• Поддержка и развитие Kubernetes-кластеров
• Развитие CI/CD (GitLab pipelines, деплой, environments)
• Работа с мониторингом и алертингом (Prometheus, Alertmanager)
• Повышение отказоустойчивости системы
• Настройка и сопровождение бэкапов и DR
• Работа с сетями и балансировкой (HAProxy, ingress)
• Управление секретами (Vault)
• Разбор инцидентов и устранение причин (а не симптомов)
• Поддержка других приложений компании
Что важно
• Опыт с Kubernetes в production
• Понимание, как работает сеть (L4/L7, прокси, балансировка)
• Умение читать логи и дебажить проблемы
• Опыт построения CI/CD
• Опыт с мониторингом (метрики, алерты, golden signals)
• Понимание отказоустойчивости (replication, failover, DR)
Будет плюсом
• Опыт с Patroni / PostgreSQL кластерами
• Работа с Vault
• Опыт с Proxmox / bare-metal
• Опыт построения платформ (platform engineering)
• Знание Terraform / IaC подходов
Не подойдёт, если
• “Я просто деплою через helm и всё работает”
• Нет опыта production-инцидентов
• Нет понимания, как устроен Kubernetes “под капотом”
• Страх лезть в чужие системы и разбираться
Как мы работаем
• Без бюрократии, но с ответственностью
• Инциденты → разбор → фиксы → улучшения
• Минимум ручных действий, максимум автоматизации
• Решаем причины, а не симптомы
Условия
• Офис / гибрид
• ЗП: обсуждается (ориентир middle)
• Свобода в выборе инструментов (если обосновано)
• Возможность реально влиять на инфраструктуру