Обо мне

Личные проекты:
1. Тематическое моделирование текстовых сообщений в службу поддержки компании.
- Отельная очистка русских и английских слов с помощью Pandas.
- Обработка слов (стеммминг или лемматизация) с использованием NLTK, spaCy, Gensim
- Построение модели тематического моделирования LDA с применением Gensim
Итоги: была построена модель тематического моделирования небольших текстов, проведен подбор гиперпараметров модели. Экспертная оценка дала удовлетворительный результат.
2. Проекты на Kaggle
Я принял участие в следующих соревнованиях:
- Digit Recognizer
- Titanic: Machine Learning from Disaster
- House Prices: Advanced Regression Techniques
- Predict Future Sales
Все соревнования направлены на классические подходы mashine learning и используют табличные данные.
3. Проект на стажировке UP TO DATA
Я вместе с командой работал над конкретным проектом от PWC - оценка транспортной компании. Наша задача состояла в том, чтобы найти ответы на конкретные вопросы технического задания, используя SQL и инструмент business intelligence - Qlik Sense.
Итог: 2 место

Профессиональные навыки
Опыт работы
Платформа
Москва
Младший аналитик
Февраль 2019 — Октябрь 2019 (9 месяцев)

- Исследование и обработка данных с помощью SQL (Oracle), написание запросов к базе данных средней сложности

- Задача тематического моделирования текстов с использованием Python (Pandas, Gensim)

- Задачи Data Wrangling, Handling Numerical Data, Handling Categorical Data

- Проведение Exploratory Data Analysis - поиск выбросов, визуализация данных, поиск паттернов в данных, построение сводных таблиц и использование оконных функций в Pandas

Высшее образование
Московский государственный технический университет имени Н.Э. Баумана
Москва
Факультет: Специального машиностроения; СМ
Сентябрь 2013—Июль 2019 (5 лет и 10 месяцев)
Проектирование, производство и эксплуатация ракет и ракетно-космических комплексов. - Призер университетской олимпиады по химии - Средний балл 4.66