Nedvision.ai (резидент Сколково, МТК) ищет перспективного junior / junior+ специалиста в область Applied ML Engineering. Формат: контракт или part-time. Вилка з/п - от 100 тыс.
Чем предстоит заниматься:
- Работать с исходными данными по недвижимости: объявления, тексты, цены, геоданные, поведение продавцов, рыночная динамика.
- Делать EDA, проверять гипотезы, выявлять проблемы в данных.
- Готовить признаки для ML-моделей: текстовые, табличные, временные, географические.
- Помогать строить модели для оценки инвестиционной привлекательности: рейтинг, справедливая цена, доходность, ликвидность.
- Участвовать в проверке качества моделей: подбор метрик, validation, анализ ошибок, интерпретация результатов, анализ деградации по сегментам.
- Постепенно брать на себя более сложные задачи по частям ML-пайплайна и поддерживать воспроизводимость экспериментов.
Требования:
- Уверенные навыки Python для работы с данными (pandas, numpy, notebooks/scripts).
- Базовый ML: classification, regression, train/test split, метрики качества, переобучение, leakage.
- Базовая статистика: распределения, корреляции, проверка гипотез, доверительные интервалы.
- SQL: выборки, join, group by (оконные функции будут плюсом).
- Понимание feature engineering и умение работать с грязными, неполными и шумными данными.
- Умение объяснять выводы простым языком и готовность разбираться в предметной области.
Будет плюсом:
- scikit-learn, CatBoost, LightGBM, XGBoost.
- Базовое понимание NLP: embeddings, sentence-transformers, признаки из текстов.
- Интерес к геоаналитике: координаты, расстояния, районы, POI, H3, PostGIS, GeoPandas.
- Опыт с Airflow, MLflow, experiment tracking.
- Опыт работы с marketplace / classifieds / real estate / fintech данными.
- Умение использовать AI coding tools для ускорения работы.
Чему научим и что дадим:
- Работа с геоаналитикой и практическими ML-задачами для недвижимости.
- Строить признаки, проводить честную валидацию (time-based split, backtesting, out-of-time validation) и доводить решения до продукта.
- Много практики на реальных данных и возможность быстрого роста в Applied ML Engineering.