Учебный центр IBS

EAS-025 Машинное обучение на практике

Для кого: ML разработчикМидл Мидл
Начало: По факту набора потока
Длительность: 1 неделя
Улучшаемые навыки:
PandasМашинное обучение
СертификатОнлайн

Описание курса

Вводный практический курс по машинному обучению. Рассматривается полный цикл построения решения: от выделения исходных данных («.xlsx файл») через построение модели и до объяснения конечному заказчику особенностей данных и специфики полученного результата.

Теоретические разделы - классификация, регрессия, предсказания, ансамбли – даются в обзорном режиме, в объёме, необходимом для корректного построения и понимания разбираемых примеров.

Модуль 1

  • Какие задачи хорошо решаются машинным обучением, а какие им пытаются решать. 
  • Что произойдёт, если вместо Data Scientist взять неспециалиста в данной области (просто разработчика/аналитика/менеджера) с ожиданием, что в процессе научится. 

Модуль 2

  • Как разобраться в исходных бизнес-данных (и вообще обнаружить в них какой бы то ни было порядок). 
  • Последовательность обработки. 
  • Что можно и нужно переложить на аналитиков предметной области, а что лучше сделать самому Data Scientist. 
  • Приоритеты решения конкретной задачи. 

Модуль 3

  • Практический раздел - хорошо формализованные задачи с подготовленными данными. 
  • Разница между задачами (бинарная/небинарная/вероятностная классификация, регрессии), перераспределение задач между классами.
  • Примеры классификации практических задач.

Модуль 4

  • Где и как проводить кластеризацию: исследование данных, проверка постановки задачи, проверки результатов. 
  • Какие случаи можно свести к кластеризации. 

Модуль 5

  • Бизнес-метрики и технические метрики. 
  • Метрики для задач классификации и регрессии, матрица ошибок. 
  • Внутренние и внешние метрики качества кластеризации. 
  • Кросс-валидация. 
  • Оценка переобучения. 

Модуль 6

  • Что делает одну модель лучше другой: параметры, признаки, ансамбли. 
  • Управление параметрами. 
  • Практика выбора признаков. 
  • Обзор инструментария для поиска лучших параметров, признаков и методов.

Модуль 7

  • Как доступно объяснить происходящее: себе, команде, клиенту. 
  • Более красивые ответы на бессмысленные вопросы. 
  • Как презентовать три терабайта результатов на одном слайде. 
  • Полуавтоматические тесты, какие точки контроля процесса действительно нужны. 
  • От живых задач к полному R&D процессу («НИОКР на практике») – разбор и анализ задач от аудитории. 

Отзывы о курсе

Отзывов пока нет
Будьте первым, напишите отзыв и поставьте оценку этому курсу.

Еще курсы