Data Scientist
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
Мы data-driven компания, принимаем бизнес-решения на основе данных.
Дирекция Data & Analytics участвует во всех ключевых бизнес-процессах компании. Мы ищем тех, кто вместе с нами будет поддерживать и развивать централизованное хранилище данных, создавать инструменты для анализа, проводить исследования, создавать продукты на основе данных, улучшать клиентский опыт Lamoda и основные метрики компании, извлекать и монетизировать большие данные.
О команде и продукте
В дирекции Data & Analytics в отделе Data Science открыты позиции в 2 направлениях:
1) Команда прайсинга: разрабатываем систему динамического ценообразования: строим модели прогнозирования продаж и решаем сложные оптимизационные задачи по подбору оптимального набора цен.
2) Команда поиска, навигации: улучшаем качество поисковой выдачи за счет доработки поисковых алгоритмов (NER, исправление опечаток), обогащаем текстовые описания товаров, улучшаем инструменты навигации.
Используемый стэк технологий: Big data (Hadoop, PySpark, Hive), Python, Catboost, Airflow, Docker, SQL, PyTorch.
Почему у нас классно:
- Хорошо выстроенные процессы: квартальное планирование по методологии OKR, двухнедельные спринты, регулярные стендапы и проектные встречи для синхронизации.
- Сильная команда middle и senior специалистов, развитое DS-сообщество, где есть возможность обмениваться знаниями на внутренних митапах
- У нас представлен полный жизненный цикл разработки data-driven продуктов с применением ML — от идеи и генерации гипотез до запуска АБ тестов. В части разработки онлайн-сервисов и деплоя моделей нам помогает команда инженеров.
Чем вам предстоит заниматься:
- Искать инсайты в данных и определять точки роста продукта;
- Разрабатывать и проверять продуктовые гипотезы;
- Работать в тесном сотрудничестве с разработчиками для вывода моделей в продакшн.
Мы ожидаем:
- Опыт в области анализа данных и машинного обучения (от 2 лет);
- Опыт работы с SQL, Hadoop, Hive, Spark;
- Владение Python, Linux, методами работы с большими данными;
- Опыт работы как минимум с 2 ML библиотеками: Scikit-learn, Vowpal Wabbit, XGBoost, Cat Boost, TensorFlow, Spark ML;
- Знания теории вероятностей и математической статистики;
- Знания в области машинного обучения, прогнозного моделирования и методов статистического анализа;
- Знание алгоритмов и структур данных;
- Высшее образование в области прикладной математики, информационных технологий, информатики и т.п;
- Английский язык на уровне технического чтения и профессионального общения.
Будет плюсом:
- Deep learning для компьютерного зрения или NLP.
Как мы работаем:
- Пишем на Python 3.6+ и PySpark 3.0;
- Для ресерча доступны два сервера (80 cores, 650Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру;
- Код с логикой ML-пайплайнов упаковываем в Docker и выкатываем, используя CI/CD-инструменты с запуском code style проверок и тестов;
- Используем Airflow для управления ML-пайплайнами и запуском их по расписанию;
- В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач;
- Регулярно проводим командные брейнштормы с целью генерации новых идей по развитию наших data-driven продуктов;
- В компании внедрена культура принятия решений на основании данных и все изменения тестируем через АБ-эксперименты.
Бонусы
- Гибкий график работы, можно удобно планировать рабочее и личное время, а также работать удаленно;
- Расширенную ДМС программу со стоматологией с первого месяца;
- Скидки на весь каталог сайта Lamoda до 40%;
- Единоразовая выплата в 15 тыс. рублей gross, которая идет в качестве частичной компенсации за обустройство рабочего места;
- Обмен знаниями внутри компании - мы организуем внутренние митапы и являемся площадкой для различных профессиональных сообществ;
- Английский язык: тем, кто регулярно использует его для работы, оплачиваем занятия полностью, остальным — щедрая скидка на языковые курсы SkyEng, Skillbox;
- Возможность посещать конференции в качестве слушателей и докладчиков (для желающих подготовиться к выступлениям с докладами или презентациями у нас есть Speakers Club);
- Вовлеченный в процессы менеджмент: наше руководство понимает и учитывает все особенности IT-разработки и готово услышать ваши крутые идеи;
- Уютный офис в Москве (МЦК Хорошёво/м. Полежаевская) с настольным теннисом, кикером, тренажерным залом и йогой, а также коворкинг в центре Санкт-Петербурга.