Кратко:

  • Создание кластера Hadoop с помощью сервиса Yandex Data Proc.
  • Создание бакет в объектном хранилище для хранения зависимостей заданий.
  • Создание сервисного аккаунта для доступа к кластеру с ролью mdb.dataproc.agent.
  • Выбор сервиса Data Proc, создание кластера с именем и версией образа 1.4.
  • Ввод публичного ключа SSH-ключа для доступа к кластеру.
  • Выбор зоны доступности для кластера и бакета в объектном хранилище.
  • Создание подкластеров для хранения данных, вычислений и управления.
  • Настройка подкластеров с числом и классом хостов, размером и типом хранилища.
  • Автоматическое масштабирование подкластеров с использованием системных метрик нагрузки на кластер.
  • Завершение создания кластера и сохранение его для использования на следующем уроке.