Data scientist
Зарплата
от 180 000 до 200 000 ₽
Требования
Местоположение и тип занятости
Компания
Создаем ПО для ФинТеха. Самые крупные банки уже доверили нам самые сложные высокотехнологичные проекты.
Описание вакансии
О компании и команде
Мы команда Data World - представители амбициозной, технологичной сферы IT, входим в ГК Технос. Создаем ПО для ФинТеха - Сбербанк, ВТБ, Альфа Банк, Газпром и др.
Мы создаем ПО для ФинТеха и приглашаем ИТ специалистов на наш внешний высокотехнологичный проект для Сбербанка.
Описание команды и проекта:
Мы – быстроразвивающаяся и очень дружная команда, которая занимается обеспечением безопасности данных в группе компаний Сбер. В частности, сканированием баз данных на наличие персональных данных с применением комбинированного подхода из ML-моделей и стандартных программных средств, обезличиванием этих данных и подтверждением безопасного статуса исследуемой базы данных.Наши задачи:
• Решаем вопросы определения чувствительных данных, ищем закономерности в структурах данных, проверяем гипотезы;
• Готовим данные для всех этапов обучения моделей (в т.ч. LLM);
• Организуем всю разметку для своих моделей;
• Проводим различные эксперименты для обучения моделей;
• Проектируем и реализуем новые решения на базе ML/LLM для решения поставленных задач
Что предстоит делать нашему будущему коллеге вместе с нами:
- Выстраивание стратегии по DS-части продуктов, развитие архитектуры ML-модели продуктов
- Определение требований к перечню, объему и качеству данных, необходимых для решения бизнес-задач
- Тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения
- Оценка как полученное решение достигает поставленных целей
- Участие в разработке решения на основе GigaChat, LLAMA2
- Организация процесса мониторинга качества LLM
- Взаимодействие с другими участниками команды для совместной работы (проверки гипотез, исследований, внедрения)
- Внедрение успешных гипотез/моделей в промышленную эксплуатацию
- Следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике
Ожидания от кандидата
- Опыт работы в области DS от 3-х лет
- Знания в области теории вероятностей, статистики, оптимизации, численных методов
- Хорошие навыки программирования, знание Python, SQL
- Свободное владение основными DS библиотеками на Python, опыт применения алгоритмов машинного обучения, понимание их преимуществ, недостатков и ограничений
- Знание методов классического NLP, навыки Prompt Engineering
- Опыт работы с LLM-моделями (LLama, ChatGPT, GigaChat) и библиотеками LLM разработки LangChain, GigaChain
- Уметь адаптировать в in-house формате доступные на рынке open source LLM-модели под задачи компании
Условия работы
- Успешный кандидат проходит процедуру оформления в нашей компании, а трудовую функцию выполняет полностью на стороне команды Сбера, c которой будет всего один этап интервью (мы упрощаем процедуру отбора)
- Оформление в соответствии с ТК РФ (не можем рассматривать кандидатов из других стран)
- Формат работы гибрид/удаленка
- Входим в список IT лицензированных аккредитованных компаний со всеми ИТ- льготами
Бонусы
- Высылаем новенький ноут для комфортной работы
- Предоставляем расширенный пакет ДМС со стоматологией
- Подлключаем курсы английского языка
- Поддерживаем разные корпоративные активности: профессиональные митапы, квизы, прокачку скилов в экспертном IT пространстве
- Получение реально классного опыта в крупнейшем банке