🤠 Бэкендеры, найдите себе команду по вайбам! Проверить мэтч → в вайб-квизе
Vasiliy Tte (vasiliy-tre), 40 лет, Россия, МоскваVasiliy Tte (vasiliy-tre), 40 лет, Россия, Москва

Vasiliy Tte

Разработка платформы для DWH и BI, Большие данные, Аналитика данныхИнженер по даннымАрхитектор баз данныхВедущий (Lead)
Рассмотрю предложения

Контакты

Войти
Возраст: 40 лет
Опыт работы: 7 лет и 3 месяца
Регистрация: 30.07.2020
Последний визит: 4 недели назад
Гражданство:
Местоположение: Россия, Москва
Дополнительно: готов к переезду и к удаленной работе
Знание языков:

Обо мне

Немного о моём опыте за последние три года:

  • Принимал участие в хакатонах: DataHack, MoreTech в качестве эксперта.
  • Занимаюсь подготовкой специалистов для работы с Bigdata, а именно: GreenPlum / PXF / Airflow / Python. Курс для аналитиков и разработчиков: Описание и описание.. Разработка учебных планов, подготовка методической документации, подготовка и проведение вебинаров, индивидуальная работа по вопросам, проведение консультаций.
  • Помимо указанных образовательных проектов, принимаю участие в качестве преподавателя - курсов DWH на основе Arenadata (otus.ru) и Greenplum для разработчиков и архитекторов баз данных (otus.ru)
  • Делюсь накопленным опытом тут: https://t.me/GreenplumSQLClub/71
    Занимаюсь развитием проекта "КУДА ИДТИ В IT" . Готовлю разные материалы, помогаю с подготовкой коллегам, провожу встречи, семинары, вебинары по направлению связанному с треком специалистов по данным (Дата инженер, разработчик хранилищ данных, Системный аналитик, BI аналитик / разработчик, DataOps);
  • Занимаюсь развитием проекта "SQL Клуб"  (обучение, обмен опытом, привлечение новых активистов. Отправной точкой в клубе является использование технологий и подходов, связанных с потребностями обеспечениями процессов по извлечению, обработке и хранению данных)
  • Был проект связанный с подготовкой начинающих "Системных аналитиков DWH" (Принимал участие: готовил входное тестирование, учебные материалы, задачи и проводил обучение и проверку работ по входному тестированию. Имел неосторожность вставить во входной тест сложную задачу на владение SQL, которая не подвергалась автоматической проверки, пришлось несколько сотен работ проверять вручную)

Занимаюсь задачами по разработки новых интеграционных решений и DataOps процессов в хранилищах данных.

О чем можно со мной поговорить:

+ dbt (Greenplum, clickhouse)

+ clickhosue интеграция с Greenplum

+ Arendata (GreenPlum)
+ Реляционные СУБД (PostgresSQL; MSSQL)
+ Реляционная теория, модели данных (3НФ, DataVault 2.0, Anchor, Kimmbal, Inmon)
+ Построение хранилищ данных (Классические DWH, DalaLake, DataMesh, LakeHouse)

+ Системная архитектура, архитектура данных

+ Разработки интеграционных взаимодействий
+ Разработки Core-движков для хранилищ данных и ETL -инструментов
+ BI Buisnes Intelligence (Tableau) и всё на чем можно делать графики
+ Витрины данных и BRD
+ Аналитика данных
+ И многое другое Linux / GIT / CICD /
+ Изучение OpenSource проектов Airflow / GreenPlum и различных
библиотек Python 

Из языков программирования ежедневно использую Python, SQL

Так же добавлю что ежедневно работаю с Linux (Bash, rest api)

 ранее изучал строго типизированные языки c++, java,  с#. Исходные коды на с++ и java читаю, иногда что то делаю на них. За последний год приходилось отлаживать java jar и дописывать обертку под них на python

В приложенной ссылке https://t.me/sqlclub_ru/108 можно открыть комментарии и там будет видео с одной из моих демонстраций по передачи опыта коллегам.

Навыки

SQL
Tableau
DWH
C#
Git
Python
Greenplum
Apache Airflow
Большие данные
Linux

Опыт работы

  • Сравни
    Инженер по данным (Ведущий)Senior Data Engineer
    Май 2024 — По настоящее время (7 месяцев)

    Разработка платформы данных Greenplum / Argo / dbt

  • МоскваБолее 5000 сотрудников
    Инженер по данным (Средний)Full-Stack DWH Developer
    Февраль 2014 — Сентябрь 2020 (6 лет и 8 месяцев)

    Имею опыт работы со стеком технологий из "BigData"

        Airflow / Python

        Greenplum (MPP Arendata DB, Teradata)

        NoSQL Rabbit, Redis

        Kafka

        CI/CD Liquibase / Gradle / Git

        Docker контейнеры
        Реляционные базы данных PostgreSQL, MS SQL     

        Airbyte

    Работал со следующими реализациями хранилищам

    а. Реляционная модель данных, (Кимбалла, Инмона, 3НФ что то среднее) генерация кода BIML/C#, автоматизация загрузки, сбора логов и генерации кода: 

    1. Система источник: OLTP Система на framework Google Web Toolkit (SQL Server, CDC);
    2. SSIS пакеты выгрузка в Staging
      Калькуляция разницы данных при помощи ключа и HASH (для обеспечения инкрементальной загрузки данных);
    3. Загрузка данных через SSIS в ODS слой хранилища. (техническая версионность данных);
    4. Расчет аналитических показателей и классификация данных по мастер системе. (техническая версионность данных);
    5. Формирование витринного слоя для систем визуализации и аналитиков.
    6. Разработка сложных дашбордов Tableau (Сбор требования, анализ системы источника создание процессов с 1 по 7 пункт и визуализация в Tableau);
    7. Распарсивание файлов Tableau для построения Data Linage между витринным слоем хранилища и полей в табло.
    8. Ручное тестирование.
    9. Доработка фреймворка C#, BIML

    б. Реляционная модель данных, генерация кода BIML/C#, автоматизация загрузки, сбора логов и генерации кода (Data Vault (RAW Vault Buissness Vault), с технической версионностью):

    1. Системы источник: REST интерфейсы, OLTP MS Dynamics
    2. Доработка фреймворка https://github.com/OptimalBI/optimal-data-engine-mssql
    3. Остальное как в предыдущих пунктах с а.1 по а.9

    Реляционная модель данных (Dimensional Fact modeling без технической версионности), без фреймворка для обслуживания:

    1. Система источник Kafka(Загрузчик на Python/Pandas)

      2. ETL процессы Talend (Cronjob)

      3. Хранение данных PosqreSQL

    SQLPythonETLDWHC#XPathGolangGitApache Kafka

Высшее образование

  • ВолгГТУ

    Волгоградский государственный технический университет
    Волгоград1071 выпускник
    Электроники и вычислительной техники (ЭиВТ)
    Сентябрь 2001 — Июнь 2006 (4 года и 9 месяцев)

    Факультет электроники и вычислительной техники, 230201 Информационные системы и технологии. 

Дополнительное образование

  • Школа больших данных (ООО "Учебный центр "Коммерсант")

    Arenadata DB для разработчиков (ADCSDB: Developer)
    Февраль 2022 — Февраль 2022 (1 месяц)

    Прохождение обучения у вендора со сдачей теста на знание Arenadata DB