Освойте управление Big Data кластерами с RT.DataLake — ключевым инструментом Hadoop-экосистемы.
Курс обучает развертыванию и настройке кластеров Hadoop с использованием RT.ClusterManager. В программе — практические кейсы по проектированию архитектуры, мониторингу и эффективному управлению кластером данных. По завершении вы сможете разворачивать кластер Hadoop, оптимизировать работу HDFS и YARN, анализировать логи и метрики, а также управлять политиками доступа.
Обзор современных методов управления данными от реляционных СУБД до NoSQL. Узнайте, как выбрать правильную систему для ваших задач и оптимизировать ее использование. Курс охватывает эволюцию хранилищ данных, реляционные и нереляционные модели, распределенные файловые системы и системы обработки потоков данных.
Освойте основы Hadoop и экосистемы Big Data. Этот тренинг дает представление об устройстве Apache Hadoop и методах разработки приложений, обрабатывающих данные на его основе. Участники познакомятся с HDFS – стандартом де-факто для долговременного надежного хранения больших объемов данных, фреймворком YARN, управляющим параллельным выполнением приложений на кластере, и сопутствующими проектами, составляющими экосистему Hadoop: Hive, Spark, HBase.