Опыт работы
Частная практика, работа без зачисления в штат
Апрель 2020 — По настоящее время (5 месяцев)

Опыт работы с задачами в рамках курсов:
1. Специализация "Машинное обучение и анализ данных" от МФТИ и Yandex на Coursera
2. "Нейронные сети и компьютерное зрение" от Samsung на Stepik.
Умение работать с данными:
1. Очистка и подготовка датасета: балансировка, масштабирование, спрямляющие пространства, стратификация, отбор признаков (перебор, добавление, add - del, отбор на основе моделей - линейная регрессия, деревья, случайный лес)
2. Понижение размерностей: Метод случайных проекций, Метод главных компонент.
3. Матричные разложения: SGD, ALS, неотрицательные матричные разложения, прогнозирование неизвестных значений, обработка пропусков
4. Поиск аномалий: SVM, параметрическое и непараметрическое восстановления плотности
5. Визуализация данных: многомерное шкалирование, t-SNE

Умение построения моделей машинного обучения:
1. Линейные модели: Линейная и логистическая регрессии, классификация (бинарная, многоклассовая)
2. Решающие деревья
3. Случайные леса (+ ансамблеевы методы и их обучение - беггинг, бутсрап)
4. Градиентный бустинг
5. Нейронные сети

Помимо построение моделей есть знания и практические навыки по необходимым метрикам и функциям потерь (MSE, квантильная ошибка, логистическая функция потерь, кросс-энтропия, дивергенция Кульбака-Лейблера , софтмакс, accuracy, precision, recall, f1_score, AUC-PRC, AUC-ROC) и методов оптимизации (SGD, Adam).

Умение применять на практике методов борьбы с переобучением: ругуляризация, кросс-валидация,настройка гиперпараметров, дропаут.

Практические навыки по кластеризации: K-means, EM - алгоритм, DBSCAN, а также оценке качества кластеризации (внутрикластерное и межкластерное расстояния, коэффициент силуэта для оценки количества кластеров)


Умение строить выводы по данным: доверительные интервалы, проверка гипотез, критерии Стьюдента, нормальность выборок, ранговые критерии, перестановычне критерии, коррелиции, множетвенные проверки гипотез.

Решение задач проводится с помощью sklearn, seaborn, pandas, numpy, pytorch, tensorflow, xgboost.

Computer vision:
Работа с архитектурами для классификации:
AlexNet, ResNet

детекции: SSD, YOLO

с помощью фреймворков: PyTorch, TensorFlow

Решение задач на kaggle.

Высшее образование
Московский государственный университет имени М.В. Ломоносова
Москва
Факультет: Механико-математический
Сентябрь 2011—Июнь 2018 (6 лет и 9 месяцев)

Управление и навигация