Учебный центр IBS
EAS-025 Машинное обучение на практике
СертификатОнлайн
Описание курса
Вводный практический курс по машинному обучению. Рассматривается полный цикл построения решения: от выделения исходных данных («.xlsx файл») через построение модели и до объяснения конечному заказчику особенностей данных и специфики полученного результата.
Теоретические разделы - классификация, регрессия, предсказания, ансамбли – даются в обзорном режиме, в объёме, необходимом для корректного построения и понимания разбираемых примеров.
Модуль 1
- Какие задачи хорошо решаются машинным обучением, а какие им пытаются решать.
- Что произойдёт, если вместо Data Scientist взять неспециалиста в данной области (просто разработчика/аналитика/менеджера) с ожиданием, что в процессе научится.
Модуль 2
- Как разобраться в исходных бизнес-данных (и вообще обнаружить в них какой бы то ни было порядок).
- Последовательность обработки.
- Что можно и нужно переложить на аналитиков предметной области, а что лучше сделать самому Data Scientist.
- Приоритеты решения конкретной задачи.
Модуль 3
- Практический раздел - хорошо формализованные задачи с подготовленными данными.
- Разница между задачами (бинарная/небинарная/вероятностная классификация, регрессии), перераспределение задач между классами.
- Примеры классификации практических задач.
Модуль 4
- Где и как проводить кластеризацию: исследование данных, проверка постановки задачи, проверки результатов.
- Какие случаи можно свести к кластеризации.
Модуль 5
- Бизнес-метрики и технические метрики.
- Метрики для задач классификации и регрессии, матрица ошибок.
- Внутренние и внешние метрики качества кластеризации.
- Кросс-валидация.
- Оценка переобучения.
Модуль 6
- Что делает одну модель лучше другой: параметры, признаки, ансамбли.
- Управление параметрами.
- Практика выбора признаков.
- Обзор инструментария для поиска лучших параметров, признаков и методов.
Модуль 7
- Как доступно объяснить происходящее: себе, команде, клиенту.
- Более красивые ответы на бессмысленные вопросы.
- Как презентовать три терабайта результатов на одном слайде.
- Полуавтоматические тесты, какие точки контроля процесса действительно нужны.
- От живых задач к полному R&D процессу («НИОКР на практике») – разбор и анализ задач от аудитории.
Отзывы о курсе
Еще курсы
Бэкенд разработчик251Фулстек разработчик147Фронтенд разработчик129Веб-разработчик99Разработчик игр89Разработчик мобильных приложений65Десктоп разработчик35Архитектор программного обеспечения30Инженер встраиваемых систем21Разработчик баз данных20Программист 1С17HTML-верстальщик6Системный инженер5Архитектор баз данных3
Все курсы в специализации