Все вакансии

Data Engineer (Python/Django/ML)

Hello, Doc! · зарплата не указана · Москва · HH · опубликовано 10 мая 2026 г.

Компания Hello, Doc!
Источник HH
Опубликовано 10 мая 2026 г.
Зарплата зарплата не указана

Описание вакансии

"Hello, Doc!" (hellodoc.app) — активно развивающаяся компания в сфере онлайн медицины. С начала 2019 года мы занимаемся развитием мобильных приложений для врачей и пациентов, чтобы сделать их общение эффективным и удобным, а доступ к медицинским услугам доступным и понятным. Сегодня это уже более 400 000 пациентов и более 30 000 профи.
Мы ищем активного, целеустремлённого разработчика, который хочет расти и развивать online медицину вмести с нами.
Обязанности:
• Построение и оптимизация Data Pipeline:
• Проектирование и поддержка ETL/ELT-процессов в Yandex Cloud (Airflow, S3).
• Организация хранения данных: работа с PostgreSQL (операционные данные) и ClickHouse (аналитика, большие объёмы результатов).
• Автоматизация загрузки, очистки и нормализации разрозненных данных от партнёров и лабораторий — снижение доли ручной обработки с текущих 95%.
• Обеспечение целостности и консистентности данных при масштабировании (новые регионы, препараты, позиции).
• Работа с внешними данными и справочниками:
Сбор данных из внешних источников: парсинг, фильтрация, валидация, обновление и хранение.
Интеграция и поддержка актуальности внешних медицинских справочников: МКБ, справочники Минздрава, базы лабораторных исследований, реестры препаратов.
Создание и поддержка маппинга между внутренними данными и внешними стандартами (18 000+ тестов и позиций).
Мониторинг изменений во внешних источниках и своевременное обновление локальных витрин.
• Разработка логики и инструментов для продукта (MedTech):
Структурирование медицинских данных для использования в продукте: связи «отклонение → рекомендация», «жалоба → чек-ап».
Разработка внутренних инструментов на Django (Admin/Interface), позволяющих врачам и экспертам самостоятельно управлять правилами, справочниками и данными — без участия разработчиков.
Реализация бизнес-логики для системы рекомендаций: автоматическое сопоставление результатов анализов с требованиями Минздрава и клиническими протоколами.
Автоматизация формирования заказов и чекапов на основе выявленных закономерностей и правил.
• Поддержка ML и аналитики:
Подготовка и витринизация данных для ML-моделей, экспертных систем и отчётности.
Взаимодействие с командой ML и предметными экспертами (врачами) для перевода бизнес-требований в технические спецификации.
Участие в разработке гибридных систем: экспертные правила + LLM/GPT (управление контекстом, подготовка базы знаний, контроль качества генерации).
• Архитектура и процессы:
Переход от «файликов сопоставления» к централизованной, документированной логической модели данных.
Самостоятельная проработка задач: трансформация размытых бизнес-пожеланий в конкретные, измеримые технические решения.
Оптимизация запросов и затрат на инфраструктуру в Yandex Cloud.
Документирование пайплайнов, справочников и бизнес-правил для передачи знаний внутри команды.
Требования:
• Hard Skills:
Уверенное знание Python (на уровне написания сложных скриптов, сервисов и фоновых задач).
• Опыт работы с Django (написание ад-панелей, CRUD-интерфейсов для внутренних инструментов).
• Глубокое знание SQL, опыт работы с PostgreSQL и колоночными БД (ClickHouse).
• Опыт оркестрации пайплайнов (Airflow).
• Опыт работы с облачными хранилищами (S3, предпочтительно Yandex Cloud).
• Понимание принципов построения DWH/Data Lake и витрин данных.
Опыт и компетенции:
• Опыт работы в команде с ML-инженерами/дата-сайентистами (понимание жизненного цикла модели, подготовка фичей, верификация данных).
• Умение работать с неструктурированными или «грязными» данными, приводить их к единому стандарту.
• Опыт разработки инструментов автоматизации для бизнес-пользователей (чтобы они могли менять настройки и правила самостоятельно).
• Опыт работы с внешними источниками данных: парсинг, нормализация, поддержка актуальности.
• Способность работать в условиях неопределённости (задачи часто формулируются общими пожеланиями, нужна самостоятельность и проактивность).
Будет плюсом:
• Опыт в MedTech / HealthTech (понимание терминов: МКБ, МИС, лабораторные анализы, клинические протоколы).
• Опыт внедрения правил бизнес-логики в код (Expert Systems, rule-based системы).
• Навыки работы с LLM/API (интеграция GPT/YaGPT для обработки текстов, генерации рекомендаций, управления контекстом).
• Опыт работы с медицинскими справочниками и нормативными источниками (Минздрав, ФФОМС, зарубежные базы).
Условия:
• Что получите в работе:
Возможность построить data-инфраструктуру «с нуля» в растущем MedTech-продукте.
Реальное влияние на продукт: ваши решения напрямую ускорят работу врачей и повысят качество рекомендаций.
Работу с интересными задачами на стыке данных, медицины и AI.
Команду, которая ценит самостоятельность и нацелена на измеримый бизнес-результат.
• Удалённая занятость.
• График работы 5/2, с 10:00 до 19:00.

Навыки

  • Python
  • Django
  • Airflow
  • PostgreSQL
  • ClickHouse
  • SQL
Открыть вакансию в ленте