Все вакансии

Data Scientist (Feature Development) - Дата-сайентист

AVO.UZ · зарплата не указана · Москва · HH · опубликовано 1 июня 2026 г.

Компания AVO.UZ
Источник HH
Опубликовано 1 июня 2026 г.
Зарплата зарплата не указана

Описание вакансии

Команда AVO создает новый технологичный розничный банк на рынке Узбекистана. Основная концепция сервиса - клиент самостоятельно может получить все услуги банка через мобильное приложение и устройства самообслуживания.
Наш сегодняшний вызов - создать самый продвинутый digital банк в Узбекистане. Мы ищем Дата-сайентиста (Data Scientist).
Обязанности:
Фичи и Feature Platform: проектировать, разрабатывать и валидировать признаки; обеспечивать их корректную доступность в обучении и на инференсе (offline/online), поддерживать документацию и жизненный цикл фичей.
Качество фичей: оценивать значимость, устойчивость и влияние признаков (статистика, leakage, drift), оптимизировать существующие и добавлять новые.
Модели end-to-end: разрабатывать и улучшать ML-модели, проводить эксперименты, валидацию и интерпретацию результатов.
Шипмент в прод: доводить решение до production-уровня совместно с ML/Engineering: пайплайны, CI/CD, MLOps, мониторинг качества и данных после релиза.
Требования:
Feature Platform / Feature Engineering
Понимание, что такое фича в продуктовой и технической логике: определение, окно агрегации, гранулярность, entity key, правила обновления, offline/online.
Умение разрабатывать фичи в платформе/feature store (Feast или аналог): источники данных, материализация, контроль качества, версионирование и повторяемость расчётов.
Знание типовых рисков: data leakage, смещение, дубли, несогласованность ключей, временные сдвиги, корректная работа с time-aware данными.
Моделирование
Уверенное построение ML-моделей на табличных данных: постановка задачи, разметка таргета, валидация (CV/Time-split), подбор метрик, тюнинг.
Умение объяснять вклад факторов и принимать решения по фичам/модели на основе данных (importance, SHAP/аналоги, ablation, стабильность по сегментам)
Технический стек: Python + SQL + DWH
Сильный Python для продакшн-кода: pandas/NumPy, sklearn, CatBoost/LightGBM (или аналоги), аккуратная структура проекта, тестируемость.
Сильный SQL: сложные join’ы, оконные функции, агрегации, оптимизация запросов; уверенная работа с DWH (Greenplum/PostgreSQL).
Понимание, как строить воспроизводимые датасеты и расчёты на больших данных (производительность, профилирование, контроль ресурсов).
Production mindset: CI/CD и MLOps
Понимание полного ML-цикла: подготовка данных → обучение → артефакты → деплой → инференс → мониторинг.
Опыт/понимание: Git, CI/CD, контейнеризация (Docker), трекинг экспериментов/артефактов (MLflow или аналог), базовый мониторинг (качество модели, drift, data quality, latency).
Плюсом будет:
Практика в задачах маркетинга/поведения клиентов: churn/retention, uplift/таргетинг, сегментации, LTV, A/B-мышление.
Опыт продуктовой аналитики и коммуникации: формулировать гипотезы, переводить результат в действие для бизнеса.
Условия:
Трудоустройство в соответствии с ТК Республики Узбекистан.
Оплачиваемый отпуск и больничные.
Помощь с релокацией для тех, кто переезжает в солнечный Ташкент.
Выдаем технику.
Высокая конкурентная заработная плата.
Амбициозный проект, в котором ты будешь играть одну из важнейших ролей.
Где предстоит работать:
Ташкент, улица Нукус, 29А - или удаленно в любом схожем часовом поясе.
Для оформления необходимо посетить офис в Ташкенте (мы оплачиваем перелет и проживание в гостинице).

Навыки

  • CI/CD
  • Python
  • SQL
  • PostgreSQL
  • Git
  • Docker
Открыть вакансию в ленте