Геопоиск Яндекс Карт ежедневно помогает миллионам людей по всему миру находить нужные места. Мы отвечаем на самые разные запросы: от простого «тамақтану» на казахском до сложного «Boğaz manzaralı hoş bir restoran» на турецком. Наша главная задача — за доли секунды понять намерение пользователя, на каком бы языке он ни писал запрос и в какой бы точке мира ни находился, и показать на карте именно то, что он ищет. Мы превращаем текстовый запрос в географический ответ, учитывая огромное количество факторов: от пробок и часов работы до культурных особенностей и неявных предпочтений. Карты — это базовая технология для многих городских сервисов Яндекса, например Такси, Доставки, Яндекс Еды. Почему это интересная задача с вызовом * Работа в международном геопоиске — это уникальный вызов на стыке технологий, языка и культуры. В отличие от классического веб-поиска мы имеем дело с физическим миром, и это всё меняет. * Языковой барьер. Пользователь может искать на русском языке в Турции, на английском — в Армении или использовать транслит. Нам нужно понимать запросы на разных языках, смешанные запросы (когда в одном запросе несколько языков) и справляться с многообразием названий одного и того же места (Eiffel Tower, Эйфелева башня, tour Eiffel). * Культурные и локальные особенности. Понятие «центр города», «популярное место» или «лучший кофе» в Стамбуле, Ереване или Дубае — это три разные сущности. Наши модели должны адаптироваться к локальному контексту и понимать, что важно для пользователя в конкретной стране. * Многогранность пользовательских нужд. Один и тот же запрос «Apple» может означать магазин техники, офис компании или рынок с фруктами. Наши алгоритмы должны в реальном времени определять правильный контекст, основываясь на геолокации, времени и истории пользователя. * Масштаб и скорость. Всё это сложное понимание должно работать с минимальной задержкой для миллионов пользователей одновременно. Это требует не только умных, но и невероятно эффективных моделей. Вы будете работать над продуктом, где результат вашего кода мгновенно влияет на опыт миллионов людей, помогая им ориентироваться в незнакомых городах и открывать для себя мир.

Обязанности:

A/B-тесты и внедрение моделей
Нужно будет разрабатывать пайплайны для быстрой проверки гипотез и выкатывать в продакшен только те решения, которые доказали свою эффективность на реальных пользователях. Работа с геоданными
Вам предстоит генерировать новые фичи на основе геоданных и пользовательского поведения. Генеративные подходы
Мы исследуем, как генеративные модели могут помочь в понимании сложных, развёрнутых запросов («ищу недорогое кафе, куда можно с собакой и где есть розетки для ноутбука») и даже в формировании персонализированных ответов-рекомендаций для пользователя. LLM для zero-shot- и few-shot-задач
Когда у нас мало данных для обучения, мы используем LLM, чтобы быстро решать задачи классификации запросов, извлечения атрибутов и даже генерации синтетических данных для обучения других моделей, что кратно ускоряет запуск на новых рынках. Больше об аналитике в Яндексе — в канале Yandex for Analytics

Ключевые навыки:

  • Уверенно владеете Python
  • Хорошо знаете теорию вероятностей и математическую статистику
  • Умеете строить метрики и проверять гипотезы
  • Умеете выдвигать гипотезы, проводить A/B-эксперименты и интерпретировать результаты