
EAS-019 Основы Impala
Начало: По мере набора группы
Длительность: 1 неделя
СертификатОнлайн
Описание курса
Глубокое понимание Apache Impala для анализа Big Data. В ходе курса вы освоите работу с кластером Impala, типами данных, запросами на выборку, загрузкой данных и пользовательскими функциями UDF. Сравнение Impala и Hive поможет определить, когда использовать каждый инструмент.
- Кластер Impala и его задачи.
- Обзор компонентов кластера Impala.
- Разбор процесса выполнения запросов в Impala.
- Практика: базовые операции с Impala.
- IMPALAD — планировщик и исполнитель запросов.
- STATESTORED — хранитель состояния кластера.
- CATALOGD — кеш метаданных таблиц.
- Ознакомление с языком описания данных DDL.
- Изучение различных типов данных, используемых в Impala, включая строковые, численные, типы данных для дат и времени, логические и составные типы данных.
- Практика: типы данных, создание таблиц.
- Структура запроса Select.
- Обзор вариантов синтаксиса соединений.
- Изучение подзапросов.
- Практика: запросы на выборку.
- Обзор идентификаторов и их использование в Impala.
- Анализ различных видов объектов базы данных и команд DDL.
- Рассмотрение синхронизации метаданных.
- Изучение различных видов таблиц и их создание.
- Освоение команд для изменения и удаления таблиц.
- Обзор возможностей для вставки данных, пакетной загрузки данных, изменения данных.
- Разбор пользовательских функций UDF.
- Практика: загрузка данных, работа с UDF.
- Обзор сходств Hive и Impala.
- Анализ отличий Hive и Impala.