В IT с 2000 года. В Data Science с 2021 года.
Программирую на Python, знаю алгоритмы и структуры данных, базовые алгоритмы анализа данных и построения ML-моделей. Умею проектировать базы данных, собирать данные из Web. Углубленные знания в линейной алгебре, математическом анализе, теории вероятностей и математической статистики. Понимаю принципы проверки статистических гипотез. Знаю основные статистические критерии и условия их применимости. Понимаю как рассчитывается объём выборки. Свободно читаю и понимаю статьи и документацию на английском языке.
Стек: Python, Git, Linux, Docker, SQL, NoSQL, MongoDB, HTML, CSS, Beautiful Soup, XPath, Selenium, Scrapy. Numpy, pandas, matplotlib, seaborn, scipy, scikit-learn. Flask API.
https://www.linkedin.com/in/aspushkarev/
Проекты:
- Спроектировал базу данных broker
https://github.com/aspushkarev/part1/pull/22/files
Стек: MySQL, DBeaver, MySQLWorkbench, Git
- Построил модель на предсказание стоимости недвижимости
https://www.kaggle.com/competitions/real-estate-price-prediction-moscow/leaderboard
(Ник - Alexander Pushkarev, на Leaderboard 85 место из 745)
Стек: Python, Git, Numpy, Pandas, Matplotlib, Seaborn, Scikit-learn. Объектно-ориентированное программирование
- Построил модель для прогнозирования выполнения долговых обязательств по текущему кредиту
https://github.com/aspushkarev/part1/pull/23/files
Стек: Python, Git, Numpy, Pandas, Matplotlib, Scikit-learn
- Написал паука, который собирал данные о товарах и складывал полученные и обработанные данные в MongoDB;
https://github.com/aspushkarev/part1/pull/20/files
Стек: Python, Git, MongoDB, HTML, CSS, Beautiful Soup, XPath, Selenium, фреймворк Scrapy
- Проверил гипотезу, что зарплата специалистов уровня Junior меньше, чем специалистов уровня Senior.
Стек: Python, Git, Numpy, Pandas, Matplotlib, Seaborn
ПАО Роснефть работает в области добычи полезных ископаемых (нефтегазодобыча), производство электроэнергии, утилизация попутного газа
Должностные обязанности:
- Выполнял технический контроль полноты и качества производства строительно-монтажных и пусконаладочных работ;
- Осуществлял мониторинг и анализ работы оборудования и каналов связи;
- Проверял качество выполнения технического обслуживания оборудования связи.
Стек: Cisco, Polycom, CCTV, Radio, Trunk Radio, Zabbix
Достижения:
- Качественно и в срок подготавливал технические решения для реализации информационных систем.
Результат - 100% выполнение задачи, поставленной Главным инженером.
- Качественно выполнял монтаж и настройку цифровой системы видеонаблюдения (Pelco).
Результат - 100% реализация проекта от проектирования до запуска в промышленную эксплуатацию.
- Качественно выполнял монтаж и настройку GSM-репитеров (PowerVawe, Picocell).
Результат - увеличение зоны покрытия сотовой связи на месторождении на 15%.
- Выполнял настройку резервного канала спутниковой связи.
Результат - повышение отказоустойчивости, отсутствие рисков в управлении технологическими процессами.
- Организация корпоративной телефонной связи на строящихся объектах Общества в сжатые сроки.
Результат - оперативное управление персоналом подрядчика на всех этапах стройки.
Обучение по курсу "Математика для Data Science".
Углубленные знания линейной алгебры, математического анализа, теории вероятностей и математической статистики.
Проекты:
Инженер автоматизированных систем обработки информации и управления
Углубленные знания алгоритмов или методов машинного обучения. Сбор данных, анализ тестовых данных. Анализ временных рядов. Работа с рекомендательными системами. Введение в Deep Learning.
Решение однородных систем линейных алгебраических уравнений (СЛАУ), собственные числа и собственные векторы матрицы, диагонализация матрицы. Матричные разложения, введение в тензоры. Теория приделов, дифференцирование, матричное дифференцирование. Теория рядов, неопределенное интегрирование, определенное и несобственное интегрирование. Оптимизация с помощью метода множителей Лагранжа. Оптимизация в классических алгоритмах машинного обучения. Преобразование Фурье, временные ряды, случайные события, случайные величины. Основные законы распределения. Моделирование случайных величин. Пуассоновский поток событий. Моделирование системы массового обслуживания. Задача оценивания и метод максимального правдоподобия. Выборочные характеристики и доверительные интервалы. Проверка гипотез в том числе в А/В тестировании. Одно- и двухфакторный дисперсионный анализ. Нахождение объёма репрезентативной выборки. Проверка гипотезы о законе распределения. Виды зависимостей. Корреляция. Исследование зависимостей: номинальные признаки, порядковые признаки и количественные признаки.