Приходите 11 марта на Хабр Семинар, поговорим о том, как бренд и коммуникации становятся частью стратегии удержания.
Приходите 11 марта на Хабр Семинар, поговорим о том, как бренд и коммуникации становятся частью стратегии удержания.

Инженер по данным
Также занимаюсь разработкой бэкенда на python: django/fastapi.
Знаком с очередями и асинхронными технологиями: kafka, rabbitmq, redis, celery, flower.
Есть опыт работы с Docker, docker-compose и Git.
Понимание принципов машинного обучения и математической статистики из учебного опыта


Выберите навык, чтобы посмотреть, какие тесты специалист уже прошел.
- разрабатывал и развивал ETL процессы
- разработка приложений с использованием PySpark
- разработка DAG в Airflow (сложные зависимости с TaskSensor)
- оптимизация хранения данных в HDFS и ClickHouse (создание и изменение таблиц, подбор индексов, оптимизация запросов)
- разработка сервиса расчета рекомендаций с использованием FastAPI (MLOps - задача)
- опыт написания dbt-моделей (переход на инкрементальную модель для оптимизации работы пайплайна)
- работа с несколькими источниками для построения единого пайплайна данных
- оптимизация сложных SQL-запросов путем устранения Broadcast Motion в Greenplum (ускорение в 2 раза)
Разработка приложения для аренды любой сущности.
Работаем в команде из ~20 человек: Backend(java and python), Frontend(react), DevOps, QA, Project manager
- разработка админ панели для мерчантов (график работы; отслеживание заказов; контроль доступных для аренды сущностей)
- интеграция сервиса оплаты (stripe)
- взаимодействие с сервисом по отправке почтовых уведомлений средствами redis, celery и flower
- использование django-celery-beat для выполнения запланированных задач
- настройка отправки уведомлений в telegram мерчанта
В рамках технологической практики писали проект по цифровизации одной из жизненных ситуаций
Разрабатывали в команде из 2 бэкендеров и 2 фронтеднеров. На бэкенде использовали DRF и FastAPI
- проектирование базы данных, нормализация данных
- настроили Docker для разработки как бэкенда, так и фронтенда
- RESTful API на DRF
- периодический парсинг данных с популярных сайтов для получения определенных категорий мероприятий с помощью celery-beat и beautifulsoup
- микросервис по отправке почтовых уведомлений на FastAPI + RabbitMQ + Celery
- подключение автоматической генерации openAPI документации
Учебный проект "Система анализа успеваемости студентов", реализованный в рамках программы Цифровых кафедр
Разработка в команде из 3 человек-бэкендеров на стеке Python + Django, для обработки данных использовали pandas, sklearn - для обучения моделей
- поднял Docker для разработки в команде
- организовал работу с Git с помощью Feature Branch Development
- реализовал обучение модели для прогнозирования отчисления студента с помощью slkearn, pandas
- спроектировали в команде RESTful API, реализованное на DRF
- настроил JWT-аутентификацию
- еженедельный сбор данных по успеваемости студентов, а также периодическое переобучение ML модели средствами redis и celery
- формирование pdf-отчетов с помощью библиотеки reportlab
- подключение Swagger для документации API
Специальность: программная инженерия.
На 1 курсе изучали ООП, SOLID, паттерны проектирования. Все это на языке Java, что помогло познакомиться со строгой типизацией, объектно-ориентированной парадигмой.
Летняя практика после 1 курса: пишем приложение для изучения английского языка на Kotlin в команде из 4 человек, взаимодействуя через GitHub.
2 курс: начал изучать Python: ООП, асинхронность, многопоточность, мультипроцессинг, requests, selenium, telegramBotAPI.
Django: реализация модели MVC через средства django(models, views, templates), Django ORM, тестирование(pytest).
DRF: концепция REST API, сериализаторы, view классы, view generics, вьюсеты, роутеры
Сопутствующие технологии: Docker, docker-compose, Nginx, Linux, gunicorn, деплой на сервер
Изучение дисциплины "Базы данных": sql(синтаксис), join-операции и их различия, проектирование баз данных, нормализация и нормальные формы, транзакции
Машинное обучение: работа с многомерными массивами(numpy), визуализация данных(matplotlib), сбор и обработка различных видов данных, работа с табличными данными(pandas), основы компьютерного зрения, основы обработки естественного языка
Математическая статистика: генеральная совокупность и выборка, квартили распределения и график box-plot, нормальное распределение, t-критерий Стьюдента, многофакторный ANOVA, АБ тесты и статистика
Решал задачи на следующие алгоритмы и структуры данных:
- префиксные суммы
- два указателя
- стеки, очереди, деки
- хеш - таблица
- деревья, обходы деревьев
- связные списки
- бинарный поиск