Учебный центр IBS

EAS-019 Основы Impala

Для кого: Аналитик по даннымДжуниор Мидл
Начало: По факту набора потока
Длительность: 1 неделя
Улучшаемые навыки:
СертификатОнлайн

Описание курса

В ходе курса вы получите глубокое понимание Apache Impala и его возможностей для обработки и анализа данных. Вы изучите роль и компоненты кластера Impala, типы данных, запросы на выборку, загрузку данных и пользовательские функции UDF, а также сравнение Impala и Hive.

Модуль 1

  • Кластер Impala и его задачи.
  • Обзор компонентов кластера Impala.
  • Разбор процесса выполнения запросов в Impala.
  • Практика – базовые операции с Impala

Модуль 2

  • IMPALAD – планировщик и исполнитель запросов.
  • STATESTORED – хранитель состояния кластера.
  • CATALOGD – кеш метаданных таблиц

Модуль 3

  • Ознакомление с языком описания данных DDL
  • Изучение различных типов данных, используемых в Impala, включая строковые, численные, типы данных для дат и времени, логические и составные типы данных
  • Практика – типы данных, создание таблиц

Модуль 4

  • Структура запроса Select
  • Обзор вариантов синтаксиса соединений
  • Изучение подзапросов
  • Практика – запросы на выборку

Модуль 5

  • Обзор идентификаторов и их использование в Impala
  • Анализ различных видов объектов базы данных и команд DDL
  • Рассмотрение синхронизации метаданных
  • Изучение различных видов таблиц и их создание
  • Освоение команд для изменения и удаления таблиц
  • Обзор возможностей для вставка данных, пакетной загрузки данных, изменения данных
  • Разбор пользовательских функций UDF
  • Практика – загрузка данных, работа с UDF

Модуль 6

  • Обзор сходств Hive и Impala
  • Анализ отличий Hive и Impala

Отзывы о курсе

Отзывов пока нет
Будьте первым, напишите отзыв и поставьте оценку этому курсу.

Еще курсы