Data Engineer

Требования

АналитикаPythonБольшие данныеPostgreSQLMongoDBDWHJavaScala

Местоположение и тип занятости

Полный рабочий деньМожно удаленно

Компания

Разработка и развитие цифровой облачной платформы, заказная разработка

Описание вакансии

Условия работы

Мы ищем специалистов для развития сервисов. В этом направлении мы создаём идеи, самостоятельно разрабатываем продукты, занимаемся прототипированием, конструированием, придумываем дизайн, программные решения и создаём инструменты для аппаратного тестирования. Для того, чтобы эти продукты были умными, мы создаём виртуального ассистента и строим вокруг него экосистему сервисов, помогающих пользователям во многих задачах. В основе лежат современные модели обработки естественного языка (NLP — Natural Language Processing), речевые технологии, алгоритмы компьютерного зрения, разрабатываем системы биометрии, модели для генерации медиаконтента и даже нейроинтерфейсы. Мы используем последние разработки в области искусственного интеллекта и машинного обучения.

У нас 4 локации – Москва, Санкт-Петербург, Нижний-Новгород, Омс

    Требования:
    • Релевантный опыт работы от 2-х лет
    • Опыт создания ETL-процедур
    • Опыт работы с разными типами данных (batch, streaming, etc)
    • Знание Python, SQL
    • Практический опыт работы с Hadoop, Greenplum, Spark, Kafka

    Бонусы

    • Возможность удаленной работы;
    • Команда профессионалов, готовых поддержать ваши инициативы;
    • Красивый и комфортный офиc по окончании пандемии;
    • Возможность работы с новыми технологиями;
    • Программа наставничества;
    • Возможности карьерного роста;
    • Расширенный социальный пакет;
    • Обучение за счет компании в корпоративном тренинг-центре;
    • Участие в профессиональных сообществах.

    Дополнительные инструкции

    • Участие в создании инфраструктуры управления корпоративными данными.
    • Разработка процедур потоковой и пакетной загрузки данных из различных типов внешних источников: Сырые данные по телеметрии устройств; Сырые данные по активности пользователей; Структурированные источники данных;
    • Разработка процедур обработки и анализа данных.
    • Разработка процедур доставки обработанных данных в внешние системы.
    • Разработка процедур контроля качества данных.