Как устроена система поощрения сотрудников в ИТ: читайте на Хабре результаты опроса о премиях и бонусах
Опыт работы
федеральное государственное бюджетное учреждение Федеральный центр тестирования
Москва
Аналитик данных
Август 2019 — По настоящее время (1 год)
- Поиск закономерностей в данных; - Поиск аномалий; - Анализ текстов; - Автоматизация скриптов отбора аномалий; - Автоматизация кластеризации наблюдаемых данных; - Обоснование выбранных методов устно и в рамках презентаций; - Объяснение алгоритмов и интерпретация полученных данных; - Отбор предикторов и построение предиктивных моделей; - Разработка алгоритмов кластеризации; - Автоматизация предиктивных моделей и моделей кластеризации. Очистка данных, предобработка данных, разработка моделей и гипотез, проверка значимости. Для обработки данных использовались всевозможные статистические методы начиная от регрессий, конфирматорного, эксплараторного факторного анализа, кластерного анализа и таблиц сопряженности, заканчивая критерием Крамера, критерием Краскела-Уоллиса и коэффициента вариации/дисперсии. Поиск наиболее эффективных методов анализа в тех или иных ситуациях в том числе с помощью научной литературы. Представление результатов в виде таблиц, графиков, презентаций с помощью Python и R (matplotlib, ggplot, plotly и т.д.). Достижения: Разработана комплексная методика поиска аномальных результатов ЕГЭ осуществляющая поиск аномалий по набору методов включающая но не ограничивающаяся - Z-value, Критерий Краскелла-Уоллиса, коэффициент вариации, коэффициент дисперсии, статистики согласия, размер эффекта, позволяющая разбить полученные аномалии на классы и группы по уровню значимости аномалий, чтобы иметь возможность работать с ними более эффективно.
PythonR
Высшее образование
Национальный исследовательский университет «Высшая школа экономики»
Москва
Факультет: Психологии
Сентябрь 2018—Ноябрь 2019 (1 год и 2 месяца)
Сибирский федеральный университет
Красноярск
Факультет: ИАС - Экономический
Сентябрь 2011—Май 2016 (4 года и 8 месяцев)