Predict — проект VK, занимающийся проектной деятельностью и созданием сервисов на основе моделей машинного обучения. Прежде всего, это сервисы связанные с маркетингом, розничными продажами, управлением рисками.
Задачи:
- выполнение adhoc-задач по применению существующих моделей и сервисов;
- разработка различных моделей машинного обучения на новых данных;
- изучение и обработка данных из различных источников;
- внедрение регулярного расчёта новых признаков, улучшение мониторинга качества данных;
- генерация и проверка гипотез по повышению качества текущих моделей и созданию новых, более высокого качества;
- развитие инфраструктуры существующих сервисов;
- написание продуктивизируемых пайплайн-скриптов (не просто Jupyter Notebook) для внедрения моделей, признаков, а также для создания и поддержки функционирования новых продуктов.
Требования:
- высшее техническое образование (с обязательным IT-профилем). Готовы также рассмотреть кандидатов с экономическим образованием или студентов последних курсов при наличии повышения квалификации на специализированных курсах (например, MADE VK, ШАД и другие);
- наличие релевантного коммерческого опыта от 1 года;
- умение разрабатывать пайплайны для эффективной обработки данных в Python, Pyspark;
- желание заниматься и развиваться в задачах с классическим ML и DS, а также в задачах с развитием инфраструктуры development и production;
- глубокие знания классического ML;
- сильные математические знания (особенно по теории вероятностей и статистике), понимание математических основ алгоритмов машинного обучения;
- уверенное программирование на Python (базовый ООП и прикладные библиотеки — NumPy, Pandas, Sklearn, LightGBM, CatBoost, Pyspark);
- знание SQL и основ баз данных.
Будет плюсом:
- опыт в задачах DE/MLE;
- опыт работы с PySpark, Hadoop;
- написание bash-скриптов, понимание возможностей интерфейса командной строки unix-подобных операционных систем;
- опыт решения базовых задач обработки текстовых данных и последовательностей;
- знание luigi.