Умею:
• Python (NumPy, pandas, scikit-learn)
• SQL (подзапросы, CTE, оконные функции)
• Сбор и парсинг данных из разных источников.
• Обработка, очистка, преобразование данных, feature engineering, EDA.
• Визуализация данных: seaborn, plotly, matplotlib.
• Статистический анализ, поиск закономерностей, взаимосвязей, корреляций в данных. Статистические тесты.
• Классическое машинное обучение: модели классификации, регрессии, кластеризации, ансамблевые модели(бэггинг, стэккинг, бустинг), временные ряды, scikit-learn.
Подбор и оптимизация гиперпараметров моделей.
Знаком со statsmodels.
• Deep learning: TensorFlow, Kears, MLP, построение архитектур, ветвление. Знакомился с RNN.
• Легко разбираюсь в документации к различным библиотекам.
Ещё могу в:
• Excel: формулы, визуализация, сводные таблицы.
• PowerQuery
• Google - таблицы
• ABC/XYZ - анализ
Ещё обо мне:
• Увлекался программированием ещё со школьных лет.
Первый язык программирования был Delphi, затем C++ и C#,
сейчас сосредоточен на Python.
• Изучать Data Science начал с 2022 года.
• Интересно применение Data Science во многих сферах, в том
числе: финансах, науке и технике.
• Хорошо даётся самообразование.
• Всегда выполняю порученную работу
максимально качественно.
• В дальнейшем намерен повышать компетенции в Data
Science, математике и программировании (есть желание
изучить C++)
На данный момент изучаю TensorFlow .
ХОББИ:
Наука, математика, программирование, инвестиции на
фондовом рынке, youtube - канал.
Разработал торговую систему прогнозирующую направление движения цены акций на месяц вперёд. Удалось добиться точности предсказания ~70%. В качестве датасета использовал исторические данные 34-х самых ликвидных акций Российского фондового рынка и экзогенные макро и микро экономические данные. Для прогноза использовал модели: Random Forest, GradientBoosting, Stacking и Bagging. Реализовал свой алгоритм подбора гиперпараметров.
Работа над улучшением качества системы продолжается: 1. Планирую применить методы глубокого обучения для прогнозирования, 2. Разработать систему парсинга табличных данных из pdf-файлов финансовой отчётности компаний.
Делал множество проектов по Data Science. Оттачивал мастерство: Python и стек библиотек работы с данными и машинным обучением, SQL, парсинг данных XML, JSON, HTML, работа с API.