Чем нужно будет заниматься:
1 Работа над широким спектром ML-задач по различным продуктам.
2 Участие в полном цикле разработки ML моделей:
- сбор данных и генерация признаков
- разработка и валидация
- развертывание (деплоймент)
- мониторинг ML моделей и их калибровка
3 Исследование доступных и новых источников данных с целью увеличения качества ML-моделей
Необходимые навыки / требования:
- знание ключевых алгоритмов машинного обучения: градиентный бустинг, логистическая регрессия, случайный лес
- высокий уровень владения Python и соответствующих библиотек CatBoost / XGBoost / LightGBM, statsmodels, scikit-learn, pandas, numpy, matplotlib, seaborn
- навыки работы с базами данных (SQL)
- опыт развертывания оффлайн и онлайн моделей (Airflow, FastAPI / Flask, Docker) будет большим преимуществом
- высшее образование в области технических / физико-математических наук