About the project
- МТС Web Services (MWS) — бигтех-компания, предоставляющая облачные, AI-сервисы и платформенные решения под разные задачи бизнеса: от работы с данными до разработки продуктов и оптимизации процессов. Также мы запустили новую публичную платформу собственной разработки — MWS Cloud Platform.
- Big Data – один из ключевых юнитов МТС.
- Сегодня Big Data – это: 20 петабайт данных, 5 000 метрик на профиль и 400 увлеченных профессионалов в команде.
- Мы – data-команда продукта МТС Защитник, который защищает миллионы пользователей от телефонного спама и мошенников. Это живая и постоянно меняющаяся задача: спамеры адаптируются под фильтры, меняют поведение и тексты, а мошенники регулярно придумывают новые схемы, используя социальную инженерию и давление на эмоции. Мы работаем с большими объёмами данных и моделями, которые должны не просто хорошо считать метрики, но и стабильно работать в продакшене с жёсткими требованиями к latency и качеству - и реально влиять на безопасность людей.
- Поэтому мы ищем Middle+/Senior ML Engineer, который поможет нам в развитии инструментов борьбы со спамом и мошенниками.
- Используемый стек ML: Python, CatBoost, PyTorch, Transformers, ONNX, Triton Inference Server, MLflow; Data: PySpark, ClickHouse, Pandas, NumPy
Responsibilities
- Поддерживать и развивать ML-модели для выявления телефонного спама и мошенничества Табличные модели и NLP: классификация текстов, анализ расшифровок звонков;
- Заниматься feature engineering У нас много витрин и источников данных, важно извлекать из них полезные сигналы;
- Участвовать в построении pipeline от данных до production-инференса Обучение, оптимизация, мониторинг;
- Участвовать в постановке задач разметки и работе с качеством данных;
- Общаться с бизнес-заказчиками: помогать формализовать задачи, согласовывать метрики, объяснять ограничения и результаты моделей;
- Предлагать и проверять новые подходы к детектированию спама и мошеннических сценариев
Requirements
- Опыт работы в Data Science / ML от 3 лет;
- Хорошее понимание классического ML и практический опыт feature engineering;
- Опыт продуктивизации ML-моделей и их сопровождения;
- Опыт в дообучении NLP-моделей под конкретные задачи: классификация, NER;
- Умение переводить бизнес-задачи в ML-формулировки и внятно объяснять результаты;
- Уверенные навыки Python и SQL;
- Будет плюсом: PySpark, Hadoop, MLOps
Conditions
- Собственную платформу MTS Ocean для получения ИТ-ресурсов, а это значит, что деплой, мониторинг, observability — не будут для тебя проблемой, ты сможешь сосредоточиться на фичах;
- Профессиональные гильдии инженеров, где мы поддерживаем друг друга и помогаем стать лучше;
- Внутреннюю площадку TechTalks для обмена опытом, дискуссий, развития навыков самопрезентации;
- Участие во внешних IT конференциях. Мы выступаем на HighLoad++, DataFest, Mobius, Test Driven Conf, Joker, DevOps, Матемаркетинг и даже проводим собственную конференцию по архитектуре True Tech Arch;
- Полезные курсы и вебинары в корпоративном университете и электронную библиотеку;
- ДМС с первого месяца работы, включая стоматологию;
- Страхование от несчастных случаев с 1 месяца работы. Материальную помощь в сложных жизненных ситуациях;
- Отпуск 28 календарных дней (+3 дополнительных дня за ненормированный рабочий день);
- Гибридный формат работы;
- Прием врачей общей практики и массаж в офисе;
- Мобильная связь за счет компании и льготные тарифы для близких;
- Подписка на онлайн-кинотеатр KION, сервис МТС Музыка, книжный сервис Строки от МТС, безлимитные мессенджеры и соцсети.