Мы ищем Senior Data Scientist.

Обязанности:

  • Заложить основу ML-разработки в компании: трекинг экспериментов, воспроизводимость, выпуск моделей и мониторинг качества;
  • Проводить исследовательский анализ данных в ClickHouse (сырые и подготовленные слои) — выявление трендов, аномалий и формирование ясного понимания того, что лежит в основе продукта Intelligence;
  • Проектировать, обучать и итеративно улучшать модели для сценариев Intelligence в пользовательских кабинетах: аналитика и предиктивные продуктовые метрики (скоринг, отток, прогнозирование, выявление аномалий), персонализация и сценарии рекомендаций действий;
  • Разрабатывать интерфейс LLM поверх аналитических данных: дизайн промптов, оценка, валидация ответов на основе ClickHouse и подготовленных корпоративных данных с соблюдением строгого контроля доступа;
  • Выполнять feature engineering преимущественно в ClickHouse с использованием SQL (агрегации и материализованные представления), избегая ненужных масштабных выгрузок за пределы кластера;
  • Поставлять минимально жизнеспособные модели (MVP); валидировать продуктовый эффект по сравнению с эвристиками и сильными базовыми моделями;
  • Проводить офлайн-оценку и онлайн-эксперименты (A/B или эквивалентные) на реальном трафике/пользователях перед масштабным запуском;
  • Взаимодействовать с data-инженерами при появлении новых источников данных или изменении схем;
  • Согласовывать гипотезы и приоритеты с продуктовыми командами бизнес-юнитов (BU).

Требования:

  • Уверенное владение Python для ML и аналитики;
  • Продвинутый SQL для аналитических выборок и feature engineering в ClickHouse (агрегации, оконные функции, оптимизация запросов с учётом производительности);
  • Практический опыт работы с ClickHouse: проектирование таблиц, ключи сортировки, индексация, агрегаты, материализованные представления;
  • Практический опыт с Pandas, NumPy и scikit-learn — обучение, валидация, интерпретация и метрики, ориентированные на продукт;
  • Крепкие знания теории вероятностей и математической статистики; тестирование гипотез, A/B или квази-эксперименты;
  • Понимание распространённых ML-алгоритмов и их ограничений;
  • Понимание колонночных аналитических баз данных;
  • Опыт полного цикла вывода ML-моделей в продакшн (от данных до сервинга), включая среды без готового ML-Ops-стека;
  • MLflow, DVC или аналогичные инструменты для воспроизводимых экспериментов и передачи результатов в разработку;
  • Понимание систем контроля версий (Git) и опыт командной разработки с использованием Git;
  • Практический опыт работы с AI и LLM через API — промптинг, сравнение моделей и контроль качества ответов для сценариев Intelligence на базе ClickHouse и подготовленных корпоративных данных.

Будет плюсом:

  • Опыт с RAG, эмбеддингами или fine-tuning.

Условия работы:

  • Работа в международной компании;
  • Гибридный формат работы (офис/дом);
  • Корпоративное обучение — курсы и тренинги;
  • Добровольное медицинское страхование после испытательного срока;
  • Эффективная программа онбординга;
  • Корпоративные мероприятия и тимбилдинги.
Ссылка на вакансию в банке вакансий на gsz.gov.⁣by: