Наталья Толстунова (tolstunova_n), 28 лет, Россия, Санкт-ПетербургНаталья Толстунова (tolstunova_n), 28 лет, Россия, Санкт-Петербург

Наталья Толстунова

Инженер по даннымМладший (Junior)
Не ищу работу

Контакты

Войти
Возраст: 28 лет
Опыт работы: 3 года и 3 месяца
Регистрация: 29.01.2022
Последний визит: 1 неделю назад
Гражданство:
Местоположение: Россия, Санкт-Петербург
Дополнительно: готова к удаленной работе
Знание языков:

Обо мне

Большое желание развиваться в области хранения, обработки и визуализации данных.

Использованные ресурсы и полученные знания при подготовке:
- решение задач на sql-ex.com
- знание основ оптимизации запросов (индексы, партиционирование, статистика) и аналитических функций
- умение работать с основными объектами СУБД (таблицы, хранимые процедуры и функции, view, триггеры)
- понимание концепций ХД и ETL процессов (построение потоков в MS SSIS)
- знакомство с базовыми понятиями и устройством MPP систем
- умение работать с Git

Люблю учиться и повышать свою экспертизу, узнавая новое. Нацелена на результат и люблю углубляться в детали.


Навыки

SQL
PostgreSQL
DWH
Python
Apache Kafka
Apache Airflow
Git

Опыт работы

  • Одна из крупнейших российских ИТ-компаний
    От 1000 до 5000 сотрудников
    Инженер по данным (Средний)Инженер данных
    Июль 2023 — По настоящее время (1 год и 6 месяцев)

    1) Интеграция источников данных в Data Lake на платформах Yandex Cloud и Azure.
    2) Обработка и анализ данных с использованием Apache Spark: разработка витрин данных с помощью PySpark, DataFrame API, и Spark SQL; реализация потоковой обработки данных.
    3) Оптимизация производительности витрин данных: настройка и улучшение Spark-приложений для повышения скорости обработки и уменьшения затрат ресурсов.
    4) Глубокие знания в Apache Airflow: разработка ДАГов со сложной логикой, использование сенсоров, выбор оптимального решения для использования зависимостей между ДАГами;
    5) Проектирование и реализация data pipeline в Azure Data Factory: интеграция данных из различных источников и построение автоматизированных процессов для создания витрин данных.
    6) Разработка решений на Python: реализация REST API-запросов
    7) Код-ревью и поддержка командных стандартов разработки: проверка и улучшение кода коллег для обеспечения качества, читаемости и соблюдения лучших практик.

  • Меняем, изменяясь!
    От 1000 до 5000 сотрудников
    Инженер по данным (Средний)Инженер данных
    Август 2021 — Апрель 2023 (1 год и 9 месяцев)

    Data Engineer

    1) Построение различных слоев данных в Greenplum (stg, ods, dm), включая создание эффективных схем хранения для аналитики
    2) Разработка сложных SQL-запросов с использованием оконных функций, динамического SQL и курсоров для решения нестандартных задач анализа и обработки данных.
    3) Оптимизация SQL-запросов в Greenplum: настройка дистрибуции, партиционирования и плана запросов для повышения производительности и сокращения времени выполнения операций
    4) Разработка решений на Python: реализация REST API-запросов, обработка и парсинг данных в формате JSON, XML, и CSV.
    5) Работа с инструментами: Airflow, Kafka, Nifi, Google BigQuery

Высшее образование

  • IAE-Гренобль

    Institut d'Administration des Entreprises
    Гренобль4 выпускника
    Management
    Сентябрь 2017 — Февраль 2018 (5 месяцев)
  • НГУ

    Новосибирский государственный университет
    Новосибирск2083 выпускника
    Экономический факультет (ЭФ)
    Сентябрь 2014 — Июль 2018 (3 года и 10 месяцев)