Data Scientist
Требования
Местоположение и тип занятости
Компания
ТОП-3 международная компания в области IT-безопасности, один из лучших работодателей России
Описание вакансии
О компании и команде
Мы – команда Machine Learning Technology Research and Development (MLTech), и мы приглашаем специалистов по Data Science решать с нами задачи на стыке машинного обучения и кибербезопасности: детектировать зловредные файлы, распознавать фишинговые веб-страницы и ловить хакеров на взломанных компьютерах.
Ожидания от кандидата
- имеешь опыт машинного обучения в индустрии;
- готов глубоко погружаться в данные, анализировать модели и строить интерпретации, общаться с заказчиками и превращать их пожелания в гипотезы;
- готов работать над задачами, в которых нельзя просто `import ml`;
- хочешь доводить проекты до прода и не боишься выходить за пределы jupyter-тетрадок;
- любишь обсуждать идеи, свой код и чужой код с коллегами;
- интересуешься безопасностью и не теряешься, услышав слова «полиморф» и «фишинг» (или хочешь во всем этом разобраться).
Хард-требования:
- умеешь писать чистый и понятный код на современном Python;
- хорошо ориентируешься в классическом ML и соответствующих библиотеках (scikit-learn, CatBoost);
- знаком с нейросетями и Pytorch;
- представляешь, как работать со Spark (или готов научиться);
- помнишь, что такое доверительный интервал;
- умеешь писать несложные Docker-файлы (или готов научиться).
Условия работы
Что предлагает наша команда:
- мы помогаем друг другу расти и добиваться результатов, решая прикладные задачи;
- у нас есть MLOps’ы, которые помогут не запутаться в инфраструктуре;
- не боимся использовать новые технологии и пробовать новые идеи;
- результаты твоей работы почувствуют на миллионах устройств по всему миру;
- используем Spark-кластер и GPU-кластер, чтобы обрабатывать огромные коллекции файлов;
- при желании о результатах работы можно рассказывать в статьях и на конференциях.
Где про нас послушать и почитать:
- Частотный и байесовский подходы оценки TPR при неполной разметке данных / Алан Савушкин - YouTube
- О хороших практиках построения инфраструктуры ML-моделей / Дмитрий Аникин - YouTube
- Prompt Injection и все-все-все: вытаскиваем максимум из AI-сервиса / Positive Hack Days 12 (phdays.com)
- How to confuse antimalware neural networks. Adversarial attacks and protection | Securelist
- Атаки на машинное обучение в антиспам-технологиях и защита от них | Securelist
- Проверяем способность ChatGPT распознавать фишинг | Securelist
- Детектирование вредоносных файлов
- Детектирование мошеннических веб-сайтов
- В будущем - и другие задачи, как про кибербез, так и про бизнес