Informatica Wywiad oparty na scenariuszu Pytania i odpowiedzi - Wprowadzenie

Informatica jest bardzo ważnym narzędziem wykorzystywanym w hurtowni danych, które pomaga w zarządzaniu dużymi ilościami danych i raportowaniu ich analizy. Poniżej znajduje się kilka pytań, które będą pomocne podczas wywiadu w Informatica.

W końcu znalazłeś swoją wymarzoną pracę w Informatica, ale zastanawiasz się, jak złamać wywiad w Informatica i jakie mogą być prawdopodobne pytania do wywiadu opartego na scenariuszu w Informatica. Każda rozmowa kwalifikacyjna jest inna, a zakres pracy również inny. Mając to na uwadze, opracowaliśmy najczęstsze pytania i odpowiedzi podczas wywiadu oparte na scenariuszu informatycznym, które pomogą Ci odnieść sukces w rozmowie.

Oto niektóre z najważniejszych pytań na podstawie wywiadu opartego na scenariuszu informatycznym. Często zadawane pytania to:

1. Jak usunąć zduplikowane rekordy w Informatica? Wyjaśnić różne sposoby na zrobienie tego?

Odpowiedź:
Istnieje wiele sposobów eliminowania duplikatów:

1. Jeśli w źródłowej bazie danych znajdują się duplikaty, użytkownik może użyć właściwości w kwalifikatorze źródłowym. Użytkownik musi przejść do zakładki Transformacja i zaznaczyć opcję „Wybierz odrębny”. Ponadto użytkownik może użyć zastąpienia SQL w tym samym celu. Użytkownik może przejść do zakładki Właściwości, a na karcie Zapytanie SQL wpisać odrębne zapytanie.
2. Użytkownik może użyć agregatora i wybrać porty jako klucz do uzyskania odrębnych wartości. Jeśli użytkownik chce znaleźć duplikaty w całej kolumnie, wszystkie porty należy wybrać jako grupę według klucza.
3. Użytkownik może również użyć Sortera z Sortuj odrębną właściwość, aby uzyskać różne wartości.
4. Wyrażenie i transformacja filtra mogą być również wykorzystane do identyfikacji i usuwania zduplikowanych danych. Jeśli dane nie są sortowane, należy je najpierw posortować.
5. Gdy właściwość w transformacji wyszukiwania zostanie zmieniona, aby używać dynamicznej pamięci podręcznej, nowy port jest dodawany do transformacji. Ta pamięć podręczna jest aktualizowana podczas odczytu danych. Jeśli źródło ma zduplikowane rekordy, użytkownik może przeglądać pamięć podręczną wyszukiwania dynamicznego, a następnie router wybiera tylko jeden odrębny rekord.

2. Jaka jest różnica między kwalifikatorem źródła a transformacją filtra?

Odpowiedź:
Transformacja kwalifikatora źródła służy do reprezentowania wierszy, które usługa integracji czyta w sesji. To aktywna transformacja. Za pomocą kwalifikatora źródła można wykonać następujące zadania:
1. Gdy istnieją dwie tabele z tej samej źródłowej bazy danych z kluczem podstawowym i transformacją klucza obcego, wówczas źródła można połączyć z jedną transformacją kwalifikatora źródła.
2. Filtrowanie wierszy, gdy usługa integracji dodaje klauzulę where do domyślnego zapytania użytkownika.
3. Gdy użytkownik chce połączenia zewnętrznego zamiast połączenia wewnętrznego, wówczas informacje o sprzężeniu są zastępowane metadanymi określonymi w zapytaniu SQL.
4. Po określeniu posortowanych portów usługa integracji używa kolejności według klauzuli do domyślnego zapytania.
5. Jeśli użytkownik zdecyduje się znaleźć odrębną wartość, usługa integracji korzysta z opcji select odrębnej od podanego zapytania.
Gdy dane, które musimy filtrować, nie są źródłem relacyjnym, użytkownik powinien zastosować transformację filtru. Pomaga użytkownikowi spełnić określony warunek filtru, aby pozwolić mu przejść lub przejść. Bezpośrednio usunie wiersze, które nie spełniają warunku, i można określić wiele warunków.

3. Czy zaprojektować mapowanie, aby załadować ostatnie 3 wiersze z płaskiego pliku do celu?

Odpowiedź:
Załóżmy, że rozpatrywany plik płaski zawiera poniższe dane:
Kolumna A
Aanchal
Priya
Karishma
Snehal
Nupura

Krok 1 : Przypisz numery wierszy do każdego rekordu. Wygeneruj numery wierszy za pomocą transformacji wyrażeń, tworząc zmienny port i zwiększając go o 1. Po tym przypisz ten zmienny port do portu wyjściowego. Po transformacji wyrażenia porty będą miały postać -

Variable_count = Variable_count + 1
O_count = Variable_count
Utwórz fałszywy port wyjściowy dla tej samej transformacji wyrażenia i przypisz 1 do tego portu. Ten fikcyjny port zawsze zwraca 1 dla każdego wiersza.
Wreszcie wyrażenie transformacji będzie wyglądało następująco:
Variable_count = Variable_count + 1
O_count = Variable_count
Dummy_output = 1

Rezultatem tej transformacji będzie:
Kolumna A O_count Dummy_output
Aanchal 1 1
Priya 2 1
Karishma 3 1
Snehal 4 1
Nupura 5 1

Krok 2 : Przekaż powyższe dane wyjściowe do agregatora i nie określaj żadnej grupy według warunków. Nowy port wyjściowy powinien zostać utworzony w agregatorze jako O_total_records i przypisać mu port O_count. Agregator zwróci ostatni wiersz. Końcowe dane wyjściowe tego kroku będą miały atrapę portu o wartości 1, a O_total_records będzie mieć całkowitą liczbę rekordów w źródle. Dane wyjściowe agregatora będą następujące: O_total_records, Dummy_output
5 1

Krok 3 : Przekaż ten wynik transformacji łączącej i zastosuj złączenie na atrapie portu. Dane posortowane według właściwości należy sprawdzić podczas transformacji łączenia. Tylko wtedy użytkownik może połączyć transformację wyrażenia i agregatora z transformacją łączenia. Warunki transformacji Joinera będą następujące:
Dummy_output (port z transformacji agregatora) = Dummy_output (port z transformacji wyrażenia)

Rezultatem transformacji stolarki będzie
Kolumna A o_count o_total_records
Aanchal 1 5
Priya 2 5
Karishma 3 5
Snehal 4 5
Nupura 5 5

Krok 4 : Po transformacji łączącej możemy wysłać to wyjście do transformacji filtru i określić warunek filtru jako O_total_records (port z agregatora) -O_count (port z wyrażenia) <= 2

W rezultacie stan filtra będzie
O_total_records - O_count <= 2

Ostatecznym wynikiem transformacji filtra będzie:
Kolumna A o_count o_total_records
Karishma 3 5
Snehal 4 5
Nupura 5 5

4. Jak załadować tylko NULL rekordy do celu? Wyjaśnić, używając przepływu mapowania?

Odpowiedź:
Rozważ poniższe dane jako źródło
Emp_Id Emp_Name Salary City Kod PIN
619101 Aanchal Singh 20000 Pune 411051
619102 Nupura Pattihal 35000 Nagpur 411014
NULL NULL 15000 Mumbai 451021

Tabela docelowa ma również strukturę tabeli jako źródło. Będziemy mieć dwie tabele, jedną zawierającą wartości NULL, a drugą, która nie zawiera wartości NULL.
Mapowanie może wyglądać następująco:

SQ -> EXP -> RTR -> TGT_NULL / TGT_NOT_NULL
EXP - transformacja wyrażeń tworzy port wyjściowy
O_FLAG = IIF ((ISNULL (emp_id) LUB ISNULL (nazwa_ emp)) LUB ISNULL (wynagrodzenie) LUB ISNULL (miasto) LUB ISNULL (kod PIN)), „NULL”, „NNULL”)
RTR - Transformacja routera dwóch grup
Grupa 1 połączona z TGT_NULL (wyrażenie O_FLAG = „NULL”)
Grupa 2 połączona z TGT_NOT_NULL (wyrażenie O_FLAG = „NNULL”)

5. Wyjaśnij, w jaki sposób można zwiększyć wydajność warunków łączenia?

Odpowiedź:
Wydajność warunków łączenia można zwiększyć, wykonując kilka prostych kroków.
1) Użytkownik musi wykonywać sprzężenia, gdy tylko jest to możliwe. Jeśli w przypadku niektórych tabel nie jest to możliwe, użytkownik może utworzyć procedurę składowaną, a następnie dołączyć do tabel w bazie danych.
2) Dane należy posortować przed zastosowaniem łączenia, jeśli to możliwe.
3) Gdy dane nie są posortowane, wówczas źródło o mniejszej liczbie wierszy należy uznać za źródło główne.
4) W przypadku posortowanej transformacji łączącej źródło o mniej zduplikowanych wartościach klucza należy uznać za źródło główne.

Polecany artykuł

Jest to przewodnik po liście pytań i odpowiedzi na podstawie wywiadu opartego na scenariuszu informatycznym, dzięki czemu kandydat może łatwo przełamać pytania dotyczące wywiadu opartego na scenariuszu informatica. Możesz także przejrzeć następujące artykuły, aby dowiedzieć się więcej -

  1. Wywiad Maven Pytania i odpowiedzi | Najpopularniejsze i najczęściej zadawane pytania
  2. 10 zaawansowanych pytań do wywiadu AngularJS dla doświadczonych
  3. Przewodnik po narzędziach ETL Informatica
  4. 12 najbardziej niesamowitych pytań i odpowiedzi na wywiad z selenem
  5. Niesamowity przewodnik po architekturze Informatica
  6. Kompletny przewodnik po Informatica vs Datastage