Скидка на вакансию
Скидка на первую вакансию
Акция до 22 декабря
👀 Бэкендеры, зовем на Публичное собеседование на Хабр Карьере! Для участия нужно → оставить заявку
Артём Ештокин (artem-eshtokin), 37 лет, Россия, МоскваАртём Ештокин (artem-eshtokin), 37 лет, Россия, Москва

Артём Ештокин

Три кита: SQL, Python, Linux. Опыт в Enterprise и "нужно сделать к вчера".Инженер по даннымСредний (Middle)
Рассмотрю предложения

Контакты

Войти
Возраст: 37 лет
Опыт работы: 1 год и 3 месяца
Регистрация: 17.05.2023
Последний визит: 4 месяца назад
Гражданство:
Местоположение: Россия, Москва
Дополнительно: готов к удаленной работе
Знание языков:

Навыки

Apache Hadoop
Apache Spark
Greenplum
Apache Airflow
PostgreSQL
Git
ETL
Linux
Python
Docker

Опыт работы

  • Внедряем решения Business Intelligence и Big Data в финансовом секторе, телекоме, страховании, ритейле и других отраслях
    МоскваОт 1000 до 5000 сотрудников
    Инженер по данным (Средний)Data Engineer
    Июнь 2023 — Август 2024 (1 год и 3 месяца)

    Стэк: Apache Hadoop (HDFS, Hive, Spark, YARN, Tez), GreenPlum/ArenaData DB, Apache AirFlow, Bitbucket, Git, TeamCity

    Проект, авг. 2023 г. - февр. 2024 г.
    ВТБ: проект миграции с Cloudera на ArenaData Hadoop
    - отладка ETL процессов
    - загрузка с источников и проверка качества данных
    - сверка витрин между старой и новой системой
    - разработка DAG для Airflow.

    Проект, март 2024 г. – настоящее время
    ВТБ: разработка витрин данных
    - enterprise-разработка витрин на фреймворке заказчика на основе аналитических прототипов
    - разработка ETL потоков ведется с использованием GreenPlum/ArenaData DB, AirFlow и др.

    Проект, апр. 2024 г. - июнь 2024 г.
    СберУнивер: Тестирование курса по экосистеме Hadoop.
    - финальное тестирование со стороны действующего разработчика в системе Hadoop
    - поиск ошибок и проверка достоверности материалов лекций
    - проверка работы системы тестирования
    - проверка тренажера (выполнение заданий на кластере Hadoop в составе HDFS, YARN, Tez, Hive, Spark и пр.)
    - проверка связанности лекций и заданий.

Высшее образование

  • МИЭТ (НИУ)

    Национальный исследовательский университет «Московский институт электронной техники»
    Зеленоград1476 выпускников
    Электроники и компьютерных технологий (ЭКТ)
    Сентябрь 2004 — Июнь 2009 (4 года и 9 месяцев)

    Специальность: Системы автоматизированного проектирования.

    Из профильных предметов можно отметить алгоритмы, C/C++, SQL.

Дополнительное образование

  • ЦДО МГТУ им. Н.Э. Баумана

    Архитектор данных (Data Architect)
    Июнь 2023 — Декабрь 2023 (6 месяцев)
  • Тинькофф Образование

    Образовательные программы для школьников, студентов и ИТ-специалистов
    Москва554 выпускника
    Анализ данных в индустрии
    Февраль 2023 — Июнь 2023 (4 месяца)
    • SQL
    • Python
    • Визуализация данных
    • Метрики
    • Математическая статистика
    • Как проводить А-Б тесты: Проверка гипотез
    • Как проводить А-Б тесты: Подготовка и проведение
    • Как делать выводы из данных
    • Модели
    • Мобильная аналитика
    • Регрессии
    • Случайный лес
  • Stepik

    Образовательная платформа и конструктор онлайн-курсов
    Санкт-Петербург7682 выпускника
    Интерактивный тренажер по SQL
    Автор курса: ДВФУ
    Январь 2023 — Январь 2023 (1 месяц)
  • Корпоративный университет Сбербанка

    Более 50 обучающих программ, направленных на развитие общебанковских профессиональных навыков
    Data Engineer
    Октябрь 2022 — Май 2023 (7 месяцев)
    • Знакомство с работой DE.
    • Структура БД.
    • Нормальные формы. SQL. DDL.
    • Создание таблиц. Работа CASE и NULL.
    • Подзапросы и агрегации.
    • Соединения и ограничения целостности.
    • Работа со строками. Регулярные выражения.
    • Unix. Pipelines. Текстовый процессинг. bash-скрипты. Система прав.
    • Unix. Cron. Мониторинг и убийство процессов. Клиент psql.
    • Python. Быстрое ревью. Python-скрипт. SQLite.
    • Python. Pandas. Подключение к PostgreSQL.
    • DWH. Выполнение SQL в базе данных. Экспорт/импорт данных.
    • DWH Layers. Inmon vs Kimball. Звезда и снежинка.
    • SCD версионность. Логические удаления. Актуальный (активный) срез.
    • CDC. Инкрементальная загрузка. Работа со стейджингом.
    • Работа с реальными источниками.
    • Разработка хранилища данных.
    • Работа с pycopg2. Построение отчётов.
    • Оптимизация и транзакции. Как выполняются запросы. План запроса.
    • Доступ к данным. Индексы. Методы соединений.
    • Сбор и проверка статистики. Партицирование.