Проект: Data Scientist Middle. Локация: любая. Длительность проекта: до 30.09.2026 (с пролонгацией). Ставка: 1800, с НДС.
Обязательные требования:
- Профильное образование/сертификаты по анализу данных и ML
- Опыт в data science от 2 лет
- Python (PEP 8), умение писать код по стандартам качества
- Знание стандартных алгоритмов и структур данных; умение писать оптимальный по времени и памяти код
- Разработка через тестирование; опыт с PyTest
- Свободное владение ООП
- Работа с данными: SQL (join, group by), оконные функции, реляционные БД
- Опыт работы на PySpark (broadcast join, Spark UI); Spark 2.2+
- Понимание теории вероятности и статистики; опыт A/B-тестирования и проверки гипотез; продвинутые методы проверки гипотез (множественная проверка, параметрические/непараметрические методы, бутстреп)
- Знание классических методов ML; изучение и имплементация продвинутых моделей (байесовские модели/PGM/VBI, RL)
- Визуализация данных: matplotlib, seaborn, plotly или BI-инструменты
- Стек: Python, SQL, Git, PyTest, Spark 2.2+, Grafana, Airflow
Задачи на проекте:
- Выбор и построение математических моделей для задач
- Декомпозиция задач, планирование и оценка сроков
- Проверка гипотез статистическими методами; обсуждение решений с бизнес-заказчиком
- Написание оптимальных SQL/PySpark-запросов и продуктивного переиспользуемого кода; оптимизация под SLA
- Создание простых аналитических сервисов (MVP), code-review, постановка и мониторинг регулярных процессов
- Участие в формировании ТЗ
Этапы отбора:
- 2 этапа: тестовое задание и интервью с ПО
Описание проекта и команды:
Крупная ритейл компания.
Важно при отклике (информацию прикладывать в отклик):
- ФИО
- Дата рождения
- Локация
- Грейд
- Рейт (ставка/час)
- Возможная дата старта
- Планы на отпуск в ближайшие 6 мес
- Штатный/партнерский/рынок
- Скрининг по требованиям (проставить +-)