Szkolenia Cloudera

Cel szkolenia dlearning

Czterodniowe szkolenie Cloudera Administrator Training for Apache Hadoop dedkowane administratorom pozwoli uczestnikom w pełni zapoznać się i zrozumieć wszystkie niezbędne kroki do obsługi i utrzymania klastra Hadoop. Od instalacji i konfiguracji przez tunowanie polegające na równoważeniu obciążenia i zmiany ustawień do osiągnięcia najlepszej wydajności i pojemności platformy. Szkolenie Cloudera to najlepsze rozwiązanie dla administratorów na co dzień pracujących z systemami Hadoop, oraz tych którzy chcieli by rozpocząć swoją przygodę z tą platformą technologiczną.

W trakcie szkolenia prowadzony jest wykład przeplatany dyskusją, burzą mózgów, wykonywaniem ćwiczeń praktycznych, uczestnicy poruszać będą m.in. takie tematy w ramach technologii około Hadoop jak:

  • YARN, MapReduce i HDFS
  • Przystosowanie prawidłowej konfiguracji sprzętowej i infrastruktury dla docelowego klastra
  • Rekomendowana konfiguracja klastra i umieszczenie technologii Hadoop w aktualnie istniejącym centrum danych
  • Jak załadować dane do klastra z dynamicznie generowanych plików za pomocą kolektora FLUME, czy z RDBMS wykorzystując narzędzie Sqoop?
  • Konfiguracja FairScheduler dla zachowania odpowiedniego podziału zasobów na klastrze w środowisku wielu użytkowników
  • Najlepsze praktyki przygotowania i utrzymania środowiska Apache Hadoop do użycia w firmie
  • Rozwiązywanie problemów, diagnozowanie, tunowanie Hadoop

Plan szkolenia Rozwiń listę

  1. Wprowadzenie
  2. Ogólnie o Apache Hadoop
    • Dlaczego Hadoop?
    • Kluczowe komponenty Hadoop
    • Podstawowe pojęcia
  3. HDFS
    • Funkcjonalności HDFS
    • Zapis i odczyt plików
    • Zawartość pamięci NameNode
    • Rzut okiem na bezpieczeństwo HDFS
    • Przypadki użycia przeglądarkowego interfejsu NameNode
    • Przypadki użycia Hadoop File Shell
  4. Ładowanie danych do HDFS
    • Przyjmowanie danych z zew. źródeł za pomocą kolektora Flume
    • Przyjmowanie danych z relacyjnych baz danych za pomocą narzędzia Sqoop
    • Interfejsy REST
    • Najlepsze praktyki ładowania danych
  5. YARN and MapReduce
    • Czym jest MapReduce?
    • Proste przypadki użycia MapReduce
    • Architektura klastra YARN
    • Zarządzanie zasobami
    • Przypadki odzyskiwania funkcjonalności po awarii
    • Przypadki użycia przeglądarkowego interfejsu YARN
    • MapReduce w wesji pierwszej
  6. Planowanie własnego klastra Hadoop
    • Poruszenie podstawowych kwestii nt planowanego klastra Hadoop
    • Jak wybrać/dobrać prawidłową konfigurację sprzętową w zależności od potrzeb
    • Połączenia sieciowe dla planowanego klastra
    • Konfiguracja Node-ów
    • Zarządzanie klastrem
  7. Instalacja i startowa konfiguracja klastra Hadoop
    • Możliwości wykonania wdrożenia
    • Instalacja Hadoop
    • Określenie konfiguracji Hadoop
    • Startowa/początkowa konfiguracja Hadoop
    • Startowa/początkowa konfiguracja YARN i MapReduce
    • Zarządzanie logowaniem
  8. Instalacja i konfigiuracja Hive, Impala i Pig
    • Hive
    • Impala
    • Pig
  9. Klienci Hadoop
    • Co oznacza bycie klientem Hadoop?
    • Instalacja i konfiguracja klientów Hadoop
    • Instalacja i konfiguracja narzędzia Hue
    • Autentykacja i autoryzacja w Hue
  10. Cloudera Manager
    • Dlaczego Cloudera Manager?
    • Możliwości i funkcjonalności Cloudera Manager
    • Jaką wersję wybrać? Express czy Enterprise?
    • Toplogia Cloudera Manager
    • Instalacja Cloudera Manager
    • Instalacja klastra Hadoop przy użyciu Cloudera Manager
    • Przypadki użycia Cloudera Manager w kontekście administracyjnym – zarządzanie, utrzymanie, rozwój
  11. Zaawansowana konfiguracja klastra
    • Zaawansowane parametry konfiguracji
    • Konfiguracja portów dla poszczególnych elementów technologii Hadoop
    • Zarządzanie dostępnościa Node-ów dla klastra
    • Konfiguracja skryptów Rack Awareness dla HDFS
    • Konfiguracja wysokiej dostępności dla HDFS - HA
  12. Bezpieczeństwo Hadoop
    • Co oznacza priorytet bezpieczeństwa w Hadoop?
    • Możliwości systemów bezpieczeństwa w Hadoop
    • Czym jest Kerberos i gdzie można go wykorzystać?
    • Jak zabezpieczyć swój klaster w oparciu o technologię Kerberos
  13. Zarządzanie i cykliczne uruchamianie zadań
    • Zarządzanie uruchomionymi zadaniami
    • Harmonogramowanie zadań
    • Konfiguracja FairScheduler
    • Zarządzanie harmonogramowaniem zadań w Impala
  14. Utrzymanie klastra
    • Sprawdzanie stanu działania HDFS
    • Kopiowanie danych pomiędzy różnymi klastrami
    • Dodawanie, usuwanie Node-ów do/z klastra
    • Procesy pozwalające zrównoważyć obciążenie i wydajność klastra
    • Podnoszenie wersji klastra
  15. Rozwiązywanie problemów i monitoring klastra
    • Podstawowy system monitoringu
    • Jak monitorować klaster?
    • Wspólne rozwiązywanie problemów z klastrem
    • Wspólne szukanie i określanie typowych błędów konfiguracji
  16. Podsumowanie
Pobierz konspekt szkolenia w formacie PDF

Dodatkowe informacje

Wymagania
  • Szkolenie jest dedykowane dla administratorów systemów oraz menadżerów IT, którzy posiadają podstawową wiedzę w zakresie technologii Linux. Wiedza w zakresie technologii Apache Hadoop nie jest wymagana.
Poziom trudności
Czas trwania 4 dni
Certyfikat

Uczestnicy szkolenia otrzymają certyfikat ukończenia kursu z patronatem i autoryzacją Cloudera. Ponadto szkolenie przygotowuje do egzaminu certyfikacyjnego Cloudera Certified Administrator for Apache Hadoop (CCAH) http://www.cloudera.com/content/cloudera/en/training/certification/ccah.html. Certyfikacja jest doskonałym wyróżnikiem, pomaga ustanowić się jako specjalistę w dziedzinie, zapewniając pracodawcom i klientom namacalny dowód swoich umiejętności i wiedzy.

Prowadzący

Certyfikowany instructor Cloudera.

Wszystkie szkolenia Cloudera

Szkolenia powiązane tematycznieRozwiń listę

Big Data


Formularz kontaktowy

Prosimy o wypełnienie poniższego formularza, jeśli chcą Państwo uzyskać więcej informacji o powyższym szkoleniu.






* pola oznaczone (*) są wymagane

Informacje o przetwarzaniu danych przez Compendium – Centrum Edukacyjne Spółka z o.o.

CENA 2180 EUR NETTO Czy wiesz, że możesz uzyskać do 100% dofinansowania na ten kurs?   Sprawdź jak »

zamknij

Kody rabatowe

Kod rabatowy, może dotyczyć (szkolenia, producenta, terminu). Jeżeli posiadasz kod rabatowy, to wpisz go w odpowiednie pole.
(kolor zielony oznacza wpisanie prawidłowego kodu | kolor czerwony oznacza, że wpisany kod jest nieprawidłowy)

FORMA SZKOLENIA ?

zamknij

Szkolenie stacjonarne

Szkolenia stacjonarne w Compendium CE odbywają się najczęściej w naszych lokalizacjach w Krakowie i Warszawie, ale także w miejscu ustalonym przez klienta. Grupa uczestnicząca w szkoleniu spotyka się w danym miejscu o określonym czasie i wraz z trenerem aktywnie uczestniczy w laboratoriach.

Szkolenie dlearning

W szkoleniach Compendium Distance Learning możesz uczestniczyć z dowolnego miejsca na świecie. Kursanci, dzięki zaawansowanej technologii, którą dostarcza Compendium CE, stale widzą i słyszą trenera, mogą mu zadawać pytania poprzez chat i mikrofon, a także uczestniczą w ćwiczeniach i laboratoriach, które rozwiązują wraz z prowadzącym. Po więcej informacji zajrzyj na stronę dlearning.eu

MATERIAŁY SZKOLENIOWE ?

zamknij

Materiały elektroniczne

Materiały elektroniczne: są to materiały szkoleniowe w wersji elektronicznej, które w zależności od dostawcy udostępniane są za pomocą dedykowanych aplikacji: Skillpipe, eVantage itd. lub w postaci dokumentów PDF.

Materiały ctab

Materiały ctab: cena zawiera tablet ctab oraz materiały szkoleniowe w formie elektronicznej bądź tradycyjne materiały szkoleniowe i materiały dodatkowe dostarczone w wersji elektronicznej w zależności od ustaleń z producentem (w postaci dokumentów PDF lub EPUB). Tak dostarczone materiały są przystosowane pod kątem wyświetlania ich na tablecie ctab. Po więcej informacji zajrzyj na stronę ctab.

 

WYBIERZ TERMIN SZKOLENIA

Zarezerwuj termin szkolenia
Terminy szkolenia dla angielskiej wersji językowej

Najbliższe szkolenia Cloudera

Harmonogram szkoleń Cloudera