Senior Full-Stack Data Scientist, Machine Learning Specialist. Имею большой опыт в анализе данных.
За свой опыт занимался таким широким спектром задач машинного обучения, как:
Занимаюсь консультациями по машинному обучению и его внедрением в production. Являюсь действующим преподавателем ВШЭ
Уровень английского: upper-intermediate
Deep Learning, Convolutional Neural Networks, Image Recognition
Задачи
• Разработка и поддержка сервиса поиска людей в социальных сетях • Тестирование и улучшение Machine Learning - моделей
• Построение, тестирование и реализация новых критериев поиска
• Разработка высоконагруженного сервиса поиска с использованием Scala иAkka
• Анализ различных данных, выявление закономерностей
• Анализ огромных (>1TB) социальных графов на Apache Spark
• Software engineering (Java, Scala), Testing (Specs2, JUnit)
• Предсказание кредитного мошенничества с использованием Machine Learning - алгоритмов
Достижения и полученные навыки
• В команде из 4 человек за очень короткие сроки (3 месяца) написал движок для поиска людей в социальных сетях
• Научился эффективно применять Apache Spark на очень больших объёмах данных (>1 TB)
• Почти в совершенстве овладел применением Python, Pandas, Numpy, etc.для анализа данных и тестирования гипотез. Сделал очень много различных отчётов, анализов и исследований на Jupyter. Научился качественной презентации исследований и полученных результатов
• Научился эффективному использованию TDD в разработке высоконагруженных систем на Scala (с использованием фрэймворковSpecs2, Mockito, TestNG, JUnit и т.д)
За время работы в компании я добился следующего:
- С нуля за кратчайшие сроки (4 дня) написал отказоустойчивый, многопоточный планировщик задач для Spark'a (на Java), который позволил сервису запускать пересчёт алгоритмов в 3 раза чаще.
- Сократил время выполнения некоторых алгоритмов на Spark'e до 5 раз за счёт уменьшения числа wide transformatinos
- Полностью переделал организацию исходных кодов рекомендательных алгоритмов и проделал почти полный их рефакторинг
- Разработал новые эффективные алгоритмы рекоммендаций. Например, анализ тональности, выделение ключевых слов и их кластеризация.
- Оптимизировал ElasticSearch-запросы
- Участвовал в продумывании и реализации новой архитектуры хранения и вычисления данных
- Написал кучу скриптов для аналитики на Spark'e
- Написал алгоритм, который повысил CTR рекомендаций для низкопосещаемых урлов почти до уровня рекомендаций на частопосещаемых урлах (на некоторых крупных площадках CTR таких рекомендаций отличался всего лишь на 0.09 %)
- Написал предсказание популярности урлов по динамике репостов в социальных сетях и динамике просмотров
- Написал распараллеленную платформу для пересчёта алгоритмов в онлайн-режиме (Akka)
- Придумал и реализовал алгоритм для стриминговой сегментации урлов по их содержимому на семантические группы
Являюсь студентом очного отделения НИУ ВШЭ (г. Москва) факультета компьютерных наук (ФКН) направления Data Science.
Преподавание: Веду во ВШЭ семинары по курсу "Прикладные методы Машинного Обучения"
Диплом: Кросс-доменная адаптация с помощью нейронных сетей на прямом распространении ошибки
Победитель студенческой олимпиады МФТИ по математике (2015)
Призёр студенческой олимпиады МФТИ по физике (2015)
В школе (СУНЦ НГУ) достиг следующих достижений:
Являюсь выпускником ШАД Яндекса. Посетил следующие курсы:
• Algorithms and Data Structures of Search 1: Data Structures, Sorting Algorithms, Dynamic Programming, Algorithms on Trees
• Algorithms and Data Structures of Search 2: Finite State Machines, Grammars, Algorithms of Substrings Search
• Discrete Math and Statistics
• C++: Basics, C++11, Smart pointers, Memory Allocation, Iterators, OOP
• Parallel and Distributed Calculations: C++11 Multithreading, OpenMP, MPI, MapReduce, Hadoop
• Python: Functional Programming, Iterators and Generators, Unit-testing, Collections, OOP
• Machine Learning 1: Metrical algorithms (KNN), Linear Regression, Decision Trees and Random Forest Ensemble (C4.5, ID3, CART), SVM, Gradient Boosting, XGBoost, Feature Selection, Grid Search, Cross Validation, SVD
• Machine Learning 2: Stacking, Clusterization (K nearest mean), Page-Rank (Pair-wise, Point-wise, SVM Light), Collaborative filtering (Pure SVD), AdaBoost
•Deep learning: Image segmentation, patterns recognition, image classification Frameworks: Tensorflow, Keras, Theano, Lasagne.
•Reinforcement learning: Q-learining, Monte-Carlo methods (Cross-entropy), SARSA, N-step Q-learning, N-step SARSA, Expected value SARSA, Deep Reinforcement Learning Frameworks: Tensorflow, Keras, Theano, Lasagne.