Szkolenia IBM

Cel szkolenia

kod: ZZ850GPL | wersja: v11.4

The IBM InfoSphere Big Match on Hadoop course will introduce students to the Probabilistic Matching Engine (PME) and how it can be used to resolve and discover entities across multiple data sets in Hadoop.  
Students will learn the basics of a PME algorithm including data model configuration, standardization, comparison and bucketing functions, weight generation, and threshold.
During the exercises, the student will work on a large use case, where they will apply their knowledge of Big Match to discover relationships be two data sets that can be used to understand the full view of the member data.

  1. Understand the capabilities of the Probabilistic Matching Engine
  2. Understand how the Probabilistic Matching engine is used with Big Insights to solve certain use cases.
  3. Understand the technical framework of the Big Match solution and how member data is derived, bucketed and compared to produce a complete entity from multiple data sets.
  4. Create a project and data model using the Big Match Console
  5. Configure the HBase tables that will be used in a Big Match solution
  6. Configure an algorithm using he Big Match console that includes Standardization, Comparison and Bucketing functions.
  7. Set up Strings for Anonymous value, Equivalency values, Frequency values, and character maps using the Big Match console
  8. Set up and run the Weight Generation process
  9. Evaluate and set thresholds for the algorithm
  10. Deploy a new algorithm to Big Match
  11. Evaluate Entity results and reconfigure algorithm based on evaluation.  E.g. Large Buckets, Large Entities, Member not belonging to any buckets, etc

The course is designed for a technical audience that will be setting up a custom algorithm for the Probabilistic Matching Engine to use Big Match on Apache Hadoop to compare, match and/or search member records across multiple data sets.

Plan szkolenia Rozwiń listę

1. Introduction to Big Match for Apache Hadoop
 - What is Big Match
 - How Big Match Works
 - Big Match Components
 - Big Match Architecture
2. Big Match Data Model Definition
 - Members
 - Attribute Types
 - Member Attributes
 - Sources
 - Information Sources
3. PME Algorithm
 - Standardization
 - Bucketing
 - Comparison Functions
4. Bucket Analysis
 - Bucket Optimization
 - Bucket Concerns
5. Weights
 - String Weights
 - Numeric Weights
 - Multi-dimensional Weights
 - Troubleshooting Weights
6. HBase Tables
 - HBase concepts
 - Big Match commands
 - Big Match Tables (.pmebktidx, .pmemdmidx, .pmeentidx)
 - Best Practices
7. BigMatch Applications
 - PME Derive
 - PME Compare
 - PME Link
 - PME Analysis

 

Pobierz konspekt szkolenia w formacie PDF

Dodatkowe informacje

Wymagania

This course has no pre-requisites.

Poziom trudności
Czas trwania 2 dni

Pozostałe szkolenia IBM | IBM Infosphere

Formularz kontaktowy

Prosimy o wypełnienie poniższego formularza, jeśli chcą Państwo uzyskać więcej informacji o powyższym szkoleniu.






* pola oznaczone (*) są wymagane

Informacje o przetwarzaniu danych przez Compendium – Centrum Edukacyjne Spółka z o.o.

CENA 1110 EUR NETTO Czy wiesz, że możesz uzyskać do 100% dofinansowania na ten kurs?   Sprawdź jak »

zamknij

Kody rabatowe

Kod rabatowy, może dotyczyć (szkolenia, producenta, terminu). Jeżeli posiadasz kod rabatowy, to wpisz go w odpowiednie pole.
(kolor zielony oznacza wpisanie prawidłowego kodu | kolor czerwony oznacza, że wpisany kod jest nieprawidłowy)

FORMA SZKOLENIA ?

zamknij

Szkolenie stacjonarne

Szkolenia stacjonarne w Compendium CE odbywają się najczęściej w naszych lokalizacjach w Krakowie i Warszawie, ale także w miejscu ustalonym przez klienta. Grupa uczestnicząca w szkoleniu spotyka się w danym miejscu o określonym czasie i wraz z trenerem aktywnie uczestniczy w laboratoriach.

MATERIAŁY SZKOLENIOWE ?

zamknij

Materiały elektroniczne

Materiały elektroniczne: są to materiały szkoleniowe w wersji elektronicznej, które w zależności od dostawcy udostępniane są za pomocą dedykowanych aplikacji: Skillpipe, eVantage itd. lub w postaci dokumentów PDF.

Materiały ctab

Materiały ctab: cena zawiera tablet ctab oraz materiały szkoleniowe w formie elektronicznej bądź tradycyjne materiały szkoleniowe i materiały dodatkowe dostarczone w wersji elektronicznej w zależności od ustaleń z producentem (w postaci dokumentów PDF lub EPUB). Tak dostarczone materiały są przystosowane pod kątem wyświetlania ich na tablecie ctab. Po więcej informacji zajrzyj na stronę ctab.

 

WYBIERZ TERMIN SZKOLENIA

Brak ustalonych terminów dla tego szkolenia.

Zaproponuj własny termin

Najbliższe szkolenia IBM

Harmonogram szkoleń IBM