Мы ищем Senior Data Scientist.
Обязанности:
- Заложить основу ML-разработки в компании: трекинг экспериментов, воспроизводимость, выпуск моделей и мониторинг качества;
- Проводить исследовательский анализ данных в ClickHouse (сырые и подготовленные слои) — выявление трендов, аномалий и формирование ясного понимания того, что лежит в основе продукта Intelligence;
- Проектировать, обучать и итеративно улучшать модели для сценариев Intelligence в пользовательских кабинетах: аналитика и предиктивные продуктовые метрики (скоринг, отток, прогнозирование, выявление аномалий), персонализация и сценарии рекомендаций действий;
- Разрабатывать интерфейс LLM поверх аналитических данных: дизайн промптов, оценка, валидация ответов на основе ClickHouse и подготовленных корпоративных данных с соблюдением строгого контроля доступа;
- Выполнять feature engineering преимущественно в ClickHouse с использованием SQL (агрегации и материализованные представления), избегая ненужных масштабных выгрузок за пределы кластера;
- Поставлять минимально жизнеспособные модели (MVP); валидировать продуктовый эффект по сравнению с эвристиками и сильными базовыми моделями;
- Проводить офлайн-оценку и онлайн-эксперименты (A/B или эквивалентные) на реальном трафике/пользователях перед масштабным запуском;
- Взаимодействовать с data-инженерами при появлении новых источников данных или изменении схем;
- Согласовывать гипотезы и приоритеты с продуктовыми командами бизнес-юнитов (BU).
Требования:
- Уверенное владение Python для ML и аналитики;
- Продвинутый SQL для аналитических выборок и feature engineering в ClickHouse (агрегации, оконные функции, оптимизация запросов с учётом производительности);
- Практический опыт работы с ClickHouse: проектирование таблиц, ключи сортировки, индексация, агрегаты, материализованные представления;
- Практический опыт с Pandas, NumPy и scikit-learn — обучение, валидация, интерпретация и метрики, ориентированные на продукт;
- Крепкие знания теории вероятностей и математической статистики; тестирование гипотез, A/B или квази-эксперименты;
- Понимание распространённых ML-алгоритмов и их ограничений;
- Понимание колонночных аналитических баз данных;
- Опыт полного цикла вывода ML-моделей в продакшн (от данных до сервинга), включая среды без готового ML-Ops-стека;
- MLflow, DVC или аналогичные инструменты для воспроизводимых экспериментов и передачи результатов в разработку;
- Понимание систем контроля версий (Git) и опыт командной разработки с использованием Git;
- Практический опыт работы с AI и LLM через API — промптинг, сравнение моделей и контроль качества ответов для сценариев Intelligence на базе ClickHouse и подготовленных корпоративных данных.
Будет плюсом:
- Опыт с RAG, эмбеддингами или fine-tuning.
Условия работы:
- Работа в международной компании;
- Гибридный формат работы (офис/дом);
- Корпоративное обучение — курсы и тренинги;
- Добровольное медицинское страхование после испытательного срока;
- Эффективная программа онбординга;
- Корпоративные мероприятия и тимбилдинги.