About the project

  • МТС Web Services (MWS) — бигтех-компания, предоставляющая облачные, AI-сервисы и платформенные решения под разные задачи бизнеса: от работы с данными до разработки продуктов и оптимизации процессов. Также мы запустили новую публичную платформу собственной разработки — MWS Cloud Platform.
  • Big Data – один из ключевых юнитов МТС.
  • Сегодня Big Data – это: 20 петабайт данных, 5 000 метрик на профиль и 400 увлеченных профессионалов в команде.
  • Мы – data-команда продукта МТС Защитник, который защищает миллионы пользователей от телефонного спама и мошенников. Это живая и постоянно меняющаяся задача: спамеры адаптируются под фильтры, меняют поведение и тексты, а мошенники регулярно придумывают новые схемы, используя социальную инженерию и давление на эмоции. Мы работаем с большими объёмами данных и моделями, которые должны не просто хорошо считать метрики, но и стабильно работать в продакшене с жёсткими требованиями к latency и качеству - и реально влиять на безопасность людей.
  • Поэтому мы ищем Middle+/Senior ML Engineer, который поможет нам в развитии инструментов борьбы со спамом и мошенниками.
  • Используемый стек ML: Python, CatBoost, PyTorch, Transformers, ONNX, Triton Inference Server, MLflow; Data: PySpark, ClickHouse, Pandas, NumPy

Responsibilities

  • Поддерживать и развивать ML-модели для выявления телефонного спама и мошенничества Табличные модели и NLP: классификация текстов, анализ расшифровок звонков;
  • Заниматься feature engineering У нас много витрин и источников данных, важно извлекать из них полезные сигналы;
  • Участвовать в построении pipeline от данных до production-инференса Обучение, оптимизация, мониторинг;
  • Участвовать в постановке задач разметки и работе с качеством данных;
  • Общаться с бизнес-заказчиками: помогать формализовать задачи, согласовывать метрики, объяснять ограничения и результаты моделей;
  • Предлагать и проверять новые подходы к детектированию спама и мошеннических сценариев

Requirements

  • Опыт работы в Data Science / ML от 3 лет;
  • Хорошее понимание классического ML и практический опыт feature engineering;
  • Опыт продуктивизации ML-моделей и их сопровождения;
  • Опыт в дообучении NLP-моделей под конкретные задачи: классификация, NER;
  • Умение переводить бизнес-задачи в ML-формулировки и внятно объяснять результаты;
  • Уверенные навыки Python и SQL;
  • Будет плюсом: PySpark, Hadoop, MLOps

Conditions

  • Собственную платформу MTS Ocean для получения ИТ-ресурсов, а это значит, что деплой, мониторинг, observability — не будут для тебя проблемой, ты сможешь сосредоточиться на фичах;
  • Профессиональные гильдии инженеров, где мы поддерживаем друг друга и помогаем стать лучше;
  • Внутреннюю площадку TechTalks для обмена опытом, дискуссий, развития навыков самопрезентации;
  • Участие во внешних IT конференциях. Мы выступаем на HighLoad++, DataFest, Mobius, Test Driven Conf, Joker, DevOps, Матемаркетинг и даже проводим собственную конференцию по архитектуре True Tech Arch;
  • Полезные курсы и вебинары в корпоративном университете и электронную библиотеку;
  • ДМС с первого месяца работы, включая стоматологию;
  • Страхование от несчастных случаев с 1 месяца работы. Материальную помощь в сложных жизненных ситуациях;
  • Отпуск 28 календарных дней (+3 дополнительных дня за ненормированный рабочий день);
  • Гибридный формат работы;
  • Прием врачей общей практики и массаж в офисе;
  • Мобильная связь за счет компании и льготные тарифы для близких;
  • Подписка на онлайн-кинотеатр KION, сервис МТС Музыка, книжный сервис Строки от МТС, безлимитные мессенджеры и соцсети.