Szkolenia Cloudera

Cel szkolenia dlearning

Trzydniowe szkolenie Cloudera Search jest przeznaczone dla programistów i inżynierów danych, którzy chcą indeksować je na platformie Hadoop w celu wykonywania w czasie rzeczywistym ciężkich zapytań. Uczestnicy dowiedzą się, jak wydobyć więcej wartościowych informacji ze swoich danych poprzez integrację Cloudera Search z zewnętrznymi systemami.

Cloudera Search to pełnotekstowe, interaktywne wyszukiwanie oraz skalowalne, elastyczne indeksowanie na platformie Hadoop oraz rozwiązaniu enterprise data hub. Napędzany przez Apache Solr, Cloudera Search dostarcza skalowalność i niezawodność do najnowszej generacji zintegrowanych, wysokoobciążających zapytań.

Poprzez prowadzone przez instruktora dyskusje i interaktywne ćwiczenia praktyczne uczestnicy zdobędą wiedzę na temat ekosystemu aplikacji Hadoop, która zawiera:

  • Wykonywanie wsadowego indeksowania danych zapisanych na HDFS i w Hbase.
  • Wykonywanie strumieniowego indeksowania w czasie rzeczywistym przy pomocy Apache Flume.
  • Indeksowanie treści w wielu językach i formatach plików.
  • Procesowanie i transformowanie napływających danych przy pomocy Morphlines.
  • Tworzenie interfejsów użytkownika dla indeksowanych danych przy użyciu Hue.
  • Integrację Cloudera Search z zewnętrznymi aplikacjami.
  • Udoskonalanie interakcji z Cloudera Search używając funkcjonalności, takich jak: wytłuszczanie, wyszukiwanie przy użyciu dyskretnych kryteriów i uwzględniania nieprawidłowej pisowni.

Plan szkolenia Rozwiń listę

  1. Wprowadzenie
  2. Wstęp do Cloudera Search
    • Co to jest Cloudera Search?
    • Pomocne funkcjonalności
    • Przypadki użycia
    • Podstawowa architektura
  3. Wykonywanie prostych zapytań
    • Wykonywanie zapytań z poziomu Admin UI
    • Podstawowa składnia
    • Techniki przybliżonych dopasowań
    • Kontrolowanie rezultatów zapytań
  4. Tworzenie bardziej skomplikowanych zapytań
    • Miara znaczenia i filtry
    • Parsery zapytań
    • Funkcje
    • Wyszukiwanie geoprzestrzenne
    • Dyskretne kryteria wyszukiwania
  5. Przygotowanie do indeksowania dokumentów
    • Wstęp do procesu indeksowania
    • Jak używać Morphlines?
    • Tworzenie plików konfiguracyjnych
    • Projektowanie schematów
    • Zarządzanie kolekcjami
  6. Indeksowanie wsadowe danych na HDFS Data przy użyciu MapReduce
    • Wstęp do wsadowego indeksowania na HDFS
    • Używanie MapReduce Indexing Tool
    • Testowanie i rozwiązywanie problemów
  7. Indeksowanie w czasie prawie-rzeczywistym używając Flume
    • Wstęp do indeksowanie w czasie prawie-rzeczywistym
    • Wprowadzenie do Apache Flume
    • Jak wykonać Indeksowanie w czasie prawie-rzeczywistym, wykrzykując Flume?
    • Testowanie i rozwiązywanie problemów
  8. Indeksowanie danych w HBase Data przy pomocy Lily
    • Co to jest Apache HBase?
    • Indeksowanie wsadowe dla HBase
    • Indeksowanie danych w HBase Tables w czasie prawie-rzeczywistym
  9. Indeksowanie danych w różnych językach i formatach
    • Typy pól i sekwencje analizatorów
    • Stemming słów, mapowanie znaków oraz wsparcie dla różnych języków
    • Wsparcie dla schematów i analiz w Admin UI
    • Wydobywane treści i metadanych używając Apache Tika
    • Indeksowanie plików binarnych w SolrCell
  10. Usprawnienie jakości i wydajności wyszukiwania
    • Dostarczanie dopasowanych wyników
    • Pomaganie użytkownikom w zdobyciu informacji
    • Wydajność i rozwiązywanie problemów z zapytaniami
  11. Tworzenie interfejsów użytkownika dla Cloudera Search
    • Wstęp do Search UI
    • Budowanie interfejsów użytkownika używając Hue
    • Integracja Cloudera Search we własnych aplikacjach
  12. Rozważania na temat wdrażania
    • Planowanie wdrożenia
    • Ustalanie wymagań sprzętowych
    • Wstęp do bezpieczeństwa
    • Aliasowanie kolekcji
  13. Podsumowanie
Pobierz konspekt szkolenia w formacie PDF

Dodatkowe informacje

Wymagania

Kurs jest przygotowany dla programistów i inżynierów danych z co najmniej podstawową znajomością technologii Hadoop i doświadczeniem w programowaniu w standardowych językach programowania tj. Java, C, C++, Perl lub Python. Uczestnicy powinni sprawnie poruszać się po linii poleceń systemu Linux i potrafić wykonać podstawowe zadania, jak tworzenie i usuwanie katalogów, wyświetlanie i zmiana uprawnień do plików, uruchamianie skryptów i analiza rezultatu ich wykonania. Nie jest konieczne wcześniejsze doświadczenie z Apache Solr lub Cloudera Search ani z HBase lub SQL.

Poziom trudności
Czas trwania 3 dni
Certyfikat

Uczestnicy otrzymają certyfikaty uczestnictwa sygnowane przez Cloudera.

Prowadzący

Certyfikowany instruktor Cloudera

Pozostałe szkolenia Cloudera | Developer

Wszystkie szkolenia Cloudera

Szkolenia powiązane tematycznieRozwiń listę

Programowanie


Formularz kontaktowy

Prosimy o wypełnienie poniższego formularza, jeśli chcą Państwo uzyskać więcej informacji o powyższym szkoleniu.






* pola oznaczone (*) są wymagane

Informacje o przetwarzaniu danych przez Compendium – Centrum Edukacyjne Spółka z o.o.

CENA 1780 EUR NETTO Czy wiesz, że możesz uzyskać do 100% dofinansowania na ten kurs?   Sprawdź jak »

zamknij

Kody rabatowe

Kod rabatowy, może dotyczyć (szkolenia, producenta, terminu). Jeżeli posiadasz kod rabatowy, to wpisz go w odpowiednie pole.
(kolor zielony oznacza wpisanie prawidłowego kodu | kolor czerwony oznacza, że wpisany kod jest nieprawidłowy)

FORMA SZKOLENIA ?

zamknij

Szkolenie stacjonarne

Szkolenia stacjonarne w Compendium CE odbywają się najczęściej w naszych lokalizacjach w Krakowie i Warszawie, ale także w miejscu ustalonym przez klienta. Grupa uczestnicząca w szkoleniu spotyka się w danym miejscu o określonym czasie i wraz z trenerem aktywnie uczestniczy w laboratoriach.

Szkolenie dlearning

W szkoleniach Compendium Distance Learning możesz uczestniczyć z dowolnego miejsca na świecie. Kursanci, dzięki zaawansowanej technologii, którą dostarcza Compendium CE, stale widzą i słyszą trenera, mogą mu zadawać pytania poprzez chat i mikrofon, a także uczestniczą w ćwiczeniach i laboratoriach, które rozwiązują wraz z prowadzącym. Po więcej informacji zajrzyj na stronę dlearning.eu

MATERIAŁY SZKOLENIOWE ?

zamknij

Materiały elektroniczne

Materiały elektroniczne: są to materiały szkoleniowe w wersji elektronicznej, które w zależności od dostawcy udostępniane są za pomocą dedykowanych aplikacji: Skillpipe, eVantage itd. lub w postaci dokumentów PDF.

Materiały ctab

Materiały ctab: cena zawiera tablet ctab oraz materiały szkoleniowe w formie elektronicznej bądź tradycyjne materiały szkoleniowe i materiały dodatkowe dostarczone w wersji elektronicznej w zależności od ustaleń z producentem (w postaci dokumentów PDF lub EPUB). Tak dostarczone materiały są przystosowane pod kątem wyświetlania ich na tablecie ctab. Po więcej informacji zajrzyj na stronę ctab.

 

WYBIERZ TERMIN SZKOLENIA

    • Informacje ogólne
    • Termin gwarantowany
    • Last minute (-10%)
    • Język obowiązujący na szkoleniu
    • Język polski
    • Język angielski
    • Informacje ogólne
    • Termin gwarantowany
    • Last minute (-10%)
    • Język obowiązujący na szkoleniu
    • Język polski
    • Język angielski
Zarezerwuj termin szkolenia
Terminy szkolenia dla angielskiej wersji językowej

Najbliższe szkolenia Cloudera

Harmonogram szkoleń Cloudera