Мегапосты:
Обо мне

Mxnet, PyTorch, Statsmodels, ML.Net, Flux, 

Julia, R, Python, F#, Stata


Кандидат наук. Опыт управленческой и проектной работы более 12 лет. Опыт работы разработчиком с 1999 г.

В наличии несколько серверов машинного обучения, отдельностоящих и в кластере для работы. Если у Вас действительно большие объёмы данных и вы не хотите отправлять их в облака, я помогу.

---

Профессиональная специализация и навыки: Machine learning, Data mining для разработки приложений и исследовательской деятельности (CRM-анализ, сегментация для маркетинговых кампаний, мерчандайзинг, маркетинговые и продуктовые исследования, PMQ-решения, скоринговые решения, психометрические исследования, эконометрика).

Информация ниже представлена для тех, кто поймёт хоть один термин из списка, т.е. для технических и аналитических профи.

----

Разработчик/аналитик на R + Shiny, Weka/Meka, Python (Pandas, Statsmodels, Scikit-learn, Keras, Theano, Tensorflow), pyspark (mllib), MS SSAS (tabular & OLAP модели, R in-database моделирование).

В статистическом обучении уверенно работаю в SPSS Modeler и SPSS Statistics (имеются профессиональные сертификаты pearson Vue по статистическому моделированию в SPSS продуктах), Stata - лучший продукт для многопоточной работы.

Также уверенно работаю в Eviews, Rapidminer, Statistica, Minitab, SAS EG, SAS JMP.

Имею опыт работы с дистрибутивами линукс: Arch, Debian, Fedora, OpenSuse, могу настроить UnixODBC или поднять вычислительный кластер.

DBMS: Clickhouse, MonetDB, Postgresql, Redis, RethinkDB

----

Владею методами прогнозной аналитики:

анализ гибридных и панельных данных (Mixed models, иерархические линейные модели), GLM + GAM, анализ временных рядов.

Многомерный анализ: факторный анализ, корреспондентский, кластерный (алгоритмы PAM, Birch-2step), факторные биплоты на качественных данных.

В машинном обучении: KNN (ML-KNN и прочие модификации), RNN, Кохонен-карты, SVM, мультиклассовые и мультилейбловые задачи.

Техники ресэмплинга, рандомизация, монте-карло симуляция и всё, что нужно для получения робастных оценок.

Большой опыт в методологии анализа CRM-данных, а также разработки коллекторского и аппликационного скоринга: технология, методология, моделирование, тестирование на всех стадиях. Много преподаю.

Профессиональные интересы: HPC - High performance computing, in-database моделирование.

----

Профессиональные цели:

Рассматриваю предложения по исследовательским проектам, консалтинг, машинное обучение, разработка алгоритмов data mining, научное руководство, организация регулярной исследовательской работы, управление проектами.

Портфолио с исследованиями высылаю по запросу. Его должно быть достаточно, чтобы не предлагать мне идиотские тестовые задания и игры в kaggle. Если Вы не считаете нужным разговаривать со мной лично и предпочитаете язык тестовых заданий, то Вы не мой работодатель. На данный момент я не вижу адекватной процедуры рекрутинга и оценки компетенции настоящих Data scientits. Тестовые задания составляют люди, которые ни ухом, ни рылом в профессии, не знают статистики, путают математические методы и анализом статистических данных, сводят профессию аналитика к обработке данных или же не имеют и 1% моего опыта. Во всех этих случаях качество рыбы оценивается по её умению карабкаться на дерево =)

Опыт работы
Проектная работа
Москва
Data mining, машинное обучение, эконометрика
Март 2005 — По настоящее время (14 лет и 11 месяцев)