🎓 Выбирайте обучение по отзывам. Мы запустили рейтинг лучших онлайн-школ, чтобы находить качественные курсы стало еще проще. Cмотреть рейтинг

Курсы по Apache Spark

Логотип Учебный центр IBSУчебный центр IBS
EAS-011 Современные подходы к управлению данными
1 нед
NoSQL
Apache Hadoop
Базы данных
Администрирование
Apache Cassandra
Apache Spark
ClickHouse
MongoDB
Машинное обучение
Администрирование баз данных
Spark Streaming
Apache Hive
32 900 ₽
Логотип Учебный центр IBSУчебный центр IBS
EAS-015 Основы Hadoop
1 нед
SQL
Apache Hadoop
Системное администрирование
Apache Spark
JDBC
Mapreduce
Big Data
Data Engineering
Администрирование баз данных
Apache Zeppelin
Apache Hive
46 200 ₽
Логотип Сетевая Академия ЛАНИТСетевая Академия ЛАНИТ
Реализация решений данных в Microsoft Azure
1 нед
Azure
SQL
Apache Spark
Power BI
48 200 ₽

Популярные курсы Программирования и IT

Бесплатные курсы Программирования и IT

Курсы Программирования и IT с трудоустройством

ТОП онлайн-курсов по spark

1. EAS-011 Современные подходы к управлению данными

Обзор современных методов управления данными от реляционных СУБД до NoSQL. Узнайте, как выбрать правильную систему для ваших задач и оптимизировать ее использование. Курс охватывает эволюцию хранилищ данных, реляционные и нереляционные модели, распределенные файловые системы и системы обработки потоков данных.

  • Базы данных
  • Хранилища данных
  • Машины баз данных
  • Массово-параллельные архитектуры
  • Гиперконвергенция
    • Какие проблемы решает, за счет чего
  • Репликация
  • Шардинг
  • Распределенные транзакции
    • Варианты структуры ключа
    • Варианты структуры значения
  • Программные интерфейсы
  • Эффективность применения нереляционных баз данных: необходимые и достаточные условия [Cassandra, HBase]
  • Модель [MongoDB]
  • Архитектура кластера.[HDFS]
  • Варианты архитектур, форматы файлов, ограничения, транзакции [Hive,Spark,Spark SQL,Parquet,ORC]
  • Распределенные системы хранения данных в оперативной памяти [Hazelcast,Ignite,Tarantool]
  • Распределенные OLAP-системы [Clickhouse, Druid]
  • Обработка потоков данных [Spark Streaming]
  • Самонастраиваемые и автономные базы данных
Дата начала: В любое время
Длительность: 1 неделя
Стоимость курса: 32 900 ₽
Цена без скидки: 32 900 ₽
Рассрочка: Нет
Помощь с трудоустройством: Нет
Сертификат об окончании: Да

2. EAS-015 Основы Hadoop

Освойте основы Hadoop и экосистемы Big Data. Этот тренинг дает представление об устройстве Apache Hadoop и методах разработки приложений, обрабатывающих данные на его основе. Участники познакомятся с HDFS – стандартом де-факто для долговременного надежного хранения больших объемов данных, фреймворком YARN, управляющим параллельным выполнением приложений на кластере, и сопутствующими проектами, составляющими экосистему Hadoop: Hive, Spark, HBase.

  • Архитектура, репликация, чтение и запись данных, команды HDFS.
  • Практика: подключение к кластеру, работа с файловой системой из shell и Hue.
  • Практика: запуск приложений.
  • Архитектура YARN, запуск приложений в YARN.
  • Практика: запуск приложений и наблюдение за кластером через UI.
  • Архитектура, метаданные таблиц, форматы файлов, язык запросов HiveQL.
  • Практика (Hue, hive, beeline, Tez UI): создание таблиц, чтение и запись CSV, Parquet, ORC, партиционирование, SQL-запросы с агрегацией и соединениями.
  • DataFrame/SQL, метаданные, форматы файлов, источники данных, RDD.
  • Практика (Zeppelin, Spark UI): чтение и запись из БД (JDBC), CSV, Parquet, партиционирование, SQL-запросы с агрегацией и соединениями, планы выполнения запросов, мониторинг.
  • Spark Streaming, Spark Structured Streaming, Flink.
  • Практика: чтение/обработка/запись потоков между Kafka, реляционной БД и файловой системой.
  • Архитектура, язык запросов.
  • Практика (HBase shell): запись и чтение данных.
Дата начала: По мере набора группы
Длительность: 1 неделя
Стоимость курса: 46 200 ₽
Цена без скидки: 46 200 ₽
Рассрочка: Нет
Формат занятий: Онлайн
Помощь с трудоустройством: Нет
Сертификат об окончании: Да

3. Реализация решений данных в Microsoft Azure

В этом курсе рассматриваются шаблоны и методы проектирования данных, связанные с работой с пакетными аналитическими решениями и решениями в реальном времени с использованием технологий платформы данных Azure. Курс начинается со знакомства с основными технологиями вычислений и хранения, которые используются для создания аналитического решения, а затем будут рассмотрены вопросы разработки аналитических уровней обслуживания и интерактивного исследования данных, хранящихся в файлах в озере данных, а также различные методы, которые можно использовать для загрузки данных с помощью возможностей Apache Spark, имеющихся в Azure Synapse Analytics или Azure Databricks.В курсе рассматриваются вопросы анализа производительности аналитической системы для оптимизации производительности загрузки данных и запросов; вопросы реализации безопасности при хранении и передаче данных, а также использование данных в аналитической системе для создания панелей мониторинга или построения прогнозных моделей в Azure Synapse Analytics.
Дата начала: По мере набора группы
Длительность: 1 неделя
Стоимость курса: 48 200 ₽
Цена без скидки: 48 200 ₽
Рассрочка: Нет
Формат занятий: Онлайн
Помощь с трудоустройством: Нет
Сертификат об окончании: Да