проведение анализа поисковой выдачи и ее регулярный мониторинг (в том числе подготовка корзин запросов и разработка метрик качества поиска)
улучшения алгоритмов поиска за счет использование новых источников данных, признаков для ранжирования и ml алгоритмов (стадии отбора кандидатов и конечного ранжирования)
разработка моделей классификации поисковых запросов и исправления опечаток
персонализация поисковой выдачи
внедрение улучшений в продакшен
Наш стэк:- numpy, scipy, sklearn, pandas;
- Implicit/LightFM/RecTools;
- PyTorch;
- SQL, PySpark;
- Elastic, Qdrant;
- HDFS, Hadoop;
- docker, airflow, k8s, redis, fast api.