О себе:
Закончил бакалавриат и магистратуру в МГТУ им. Н.Э. Баумана с красным дипломом. Проходил программу обмена в Техническом университете Мюнхена.
Во время обучения в Германии проходил курс по анализу данных. По возвращении в России интерес к данной сфере не угас и я открыл для себя область машинного обучения.
Я выбрал направление Data Science, так как нахожу интересным то, что с помощью относительно простых и понятных математических операций компьютер может делать те же действия, что и человек, а иногда даже больше.
Саморазвитие:
Начал свой путь с получения теории на платформе Coursera (Специализация "Машинное обучение и анализ данных" от Яндекса и МФТИ) и Udemy. Посещал DataFest от Open Data Science.
На данный момент помимо проектов в рамках Яндекс.Практикума (https://github.com/Energet000/Yandex_projects) написал проект по распознаванию объектов на видео и чат-бота для Telegram.
Soft skills:
- Вел переговоры как с клиентами, так и с другими отделами в компании для быстрой реализации проекта
- Планировал время на выполнение различных задач, чтобы укладываться в сроки
- Выявлял потребности клиентов и подбирал оптимальное решение
Хобби:
- Реализую небольшие pet проекты на МК типа arduino (домашняя метеостанция)
Разработал и оптимизировал конвейеры подготовки данных для формирования дашбордов для внутреннего использования командами банка ВТБ. Преобразования выполнялись с помощью Apache Spark (Scala), в качестве оркестратора использовался Airflow.
Разработал и оптимизировал прикладные витрины для бизнес-слоя корпоративного хранилища ВТБ на основе Greenplum с использованием Airflow и функций PL/pgSQL. Реализовал объекты с инкрементальной загрузкой данных в приемник.
Компания "Эрствак" является производителем и дистрибьютором различной вакуумной и испытательной техники.
Обязанности на рабочем месте включали в себя: общение с клиентами, выявление их потребностей и подбор оборудования; общение с иностранными и отечественными поставщиками; работа с отделами внутри компании для выполнения проектов.
По окончании обучения были получены следующие навыки:
- Математика и анализ данных на Python
- Исследовательский и статистический анализ данных
- Работа с матрицами и тензорами
- Предобработка данных: работа с пропусками, выбросами и категориальными переменными
- Выделение значимых признаков и генерация новых
- Использование методов бустинга и бэггинга над решающими деревьями для увеличения качества моделей
- Оптимизация гиперпараметров модели через GridSearchCV или Optuna
- Предобработка текстов и изображений
- Создание и работа с нейронными сетями
- Работа с временными рядами
- Получение информации из баз данных с помощью SQL
Основные проекты:
1) Предсказание спроса на такси на следующий час. Модель позволяет компании оптимизировать ресурсы и подсказывать сколько потребуется свободных машин для удовлетворения спроса клиентов.
Стек: ML, pandas, sklearn, LightGBM, matplotlib, numpy, statmodels, bootstrap, boosting
2) Сверточная нейронная сеть для предсказания возраста по фотографии. Основываясь на предсказания модели, можно увеличить клиентоориентированность магазина, вводить специальные акции и скидки, что в свою очередь увеличит популярность и прибыль компании.
Стек: CV, ResNet, keras, DL, ML, pandas, matplotlib, image augmentation, seaborn
3) Определение наиболее прибыльного региона для добычи нефти. Модель на основе характеристик со скважин каждого региона предсказывает объемы нефти и возможную прибыль, на основе которых выбирается новый регион для разработки месторождения.
Стек: A/B - тестирование, sklearn, bootstrap, LightGBM, boosting, math, numpy, pandas, scipy, ML
Стандартные запросы к базам данных, подзапросы, оконные функции, изменение баз данных
Освоил основные алгоритмы задач компьютерного зрения в области классификации и сегментации изображений, детекции объектов.
Написал телеграм-бота для переноса стиля с одного изображения на другой и программу по детекции и подсчету машин на стоянке
Получил знания в области мат.статистики и проверке гипотез, построил модели для задач классификации и регрессии