Wprowadzenie do metod jądra

Jądra lub metody jądra (zwane również funkcjami jądra) to zestawy różnych rodzajów algorytmów używanych do analizy wzorców. Służą do rozwiązania problemu nieliniowego za pomocą klasyfikatora liniowego. Metody jądra są stosowane w SVM (maszyny wektorów wspomagających), które są używane w problemach z klasyfikacją i regresją. SVM wykorzystuje tak zwaną „sztuczkę jądra”, w której dane są przekształcane i znajduje się optymalna granica dla możliwych wyników.

Potrzeba metody jądra i jej działanie

Zanim przejdziemy do pracy z metodami jądra, ważniejsze jest zrozumienie obsługi maszyn wektorowych lub SVM, ponieważ jądra są implementowane w modelach SVM. Tak więc maszyny wektorów wsparcia są nadzorowanymi algorytmami uczenia maszynowego, które są używane w problemach z klasyfikacją i regresją, takich jak klasyfikacja jabłka do klasy owoców podczas klasyfikowania lwa do zwierzęcia klasowego.

Aby to zademonstrować, poniżej wyglądają obsługiwane maszyny wektorowe:

Tutaj widzimy hiperpłaszczyznę oddzielającą zielone kropki od niebieskich. Hiperpłaszczyzna jest o jeden wymiar mniejsza niż płaszczyzna otoczenia. Np. Na powyższym rysunku mamy 2 wymiary, które reprezentują przestrzeń otoczenia, ale samotny, który dzieli lub klasyfikuje przestrzeń, jest o jeden wymiar mniejszy niż przestrzeń otoczenia i nazywa się hiperpłaszczyzną.

Ale co, jeśli mamy takie dane wejściowe:

Bardzo trudno jest rozwiązać tę klasyfikację za pomocą klasyfikatora liniowego, ponieważ nie ma dobrej linii liniowej, która mogłaby być w stanie sklasyfikować czerwone i zielone kropki, ponieważ punkty są losowo rozmieszczone. Nadchodzi użycie funkcji jądra, która przenosi punkty na wyższe wymiary, rozwiązuje problem i zwraca dane wyjściowe. Pomyśl o tym w ten sposób, widzimy, że zielone kropki są zamknięte w pewnym obszarze obwodowym, podczas gdy czerwona leży na zewnątrz, podobnie mogą być inne scenariusze, w których zielone kropki mogą być rozmieszczone w obszarze w kształcie trapezu.

Więc to, co robimy, to przekształcenie dwuwymiarowej płaszczyzny, która została najpierw sklasyfikowana przez jednowymiarową hiperpłaszczyznę („lub linię prostą”) w obszar trójwymiarowy, a tutaj nasz klasyfikator, tj. Hiperpłaszczyzna, nie będzie linią prostą, ale dwuwymiarową -wymiarowa płaszczyzna, która wycina obszar.

Aby uzyskać matematyczne zrozumienie jądra, zrozummy równanie jądra Lili Jiang, które jest:

K (x, y) = gdzie,
K to funkcja jądra,
X i Y są wejściami wymiarowymi,
f jest mapą od przestrzeni n-wymiarowej do m-wymiarowej, a
jest iloczynem kropkowym.

Ilustracja za pomocą przykładu.

Powiedzmy, że mamy dwa punkty, x = (2, 3, 4) iy = (3, 4, 5)

Jak widzieliśmy, K (x, y) =.

Najpierw obliczmy

f (x) = (x1x1, x1x2, x1x3, x2x1, x2x2, x2x3, x3x1, x3x2, x3x3)
f (y) = (y1y1, y1y2, y1y3, y2y1, y2y2, y2y3, y3y1, y3y2, y3y3)
więc,
f (2, 3, 4) = (4, 6, 8, 6, 9, 12, 8, 12, 16) i
f (3, 4, 5) = (9, 12, 15, 12, 16, 20, 15, 20, 25)
więc iloczyn kropkowy,
f (x). f (y) = f (2, 3, 4). f (3, 4, 5) =
(36 + 72 + 120 + 72 + 144 + 240 + 120 + 240 + 400) =
1444
I,
K (x, y) = (2 * 3 + 3 * 4 + 4 * 5) 2 = (6 + 12 + 20) 2 = 38 * 38 = 1444.

To, jak się dowiadujemy, f (x) .f (y) i K (x, y) dają nam ten sam wynik, ale poprzednia metoda wymagała wielu obliczeń (z powodu rzutowania 3 wymiarów na 9 wymiarów) przy użyciu jądro było o wiele łatwiejsze.

Rodzaje jądra i metody w SVM

Zobaczmy niektóre funkcje jądra lub typy używane w SVM:

1. Jądro liniowe - powiedzmy, że mamy dwa wektory o nazwach x1 i Y1, wówczas jądro liniowe jest zdefiniowane przez iloczyn iloczynu tych dwóch wektorów:

K (x1, x2) = x1. x2

2. Jądro wielomianowe - Jądro wielomianowe jest zdefiniowane przez następujące równanie:

K (x1, x2) = (x1. X2 + 1) d,

Gdzie,

d jest stopniem wielomianu, a x1 i x2 są wektorami

3. Jądro Gaussa - Jądro to przykład jądra radialnej funkcji bazowej. Poniżej znajduje się równanie tego:

Dana sigma odgrywa bardzo ważną rolę w działaniu jądra Gaussa i nie należy jej przeceniać i nie należy jej lekceważyć, należy ją dokładnie dostroić w zależności od problemu.

4. Jądro wykładnicze - Jest to ściśle związane z poprzednim jądrem, tj. Jądrem Gaussa, z tą różnicą, że kwadrat normy jest usuwany.

Funkcja funkcji wykładniczej to:


Jest to także funkcja jądra bazująca na radiach.

5. Jądro Laplaciana - Ten rodzaj jądra jest mniej podatny na zmiany i jest całkowicie równy omawianemu wcześniej jądru funkcji wykładniczej, równanie jądra Laplaciana jest podane jako:

6. Jądro hiperboliczne lub sigmoidalne - jądro to jest używane w obszarach uczenia maszynowego w sieciach neuronowych. Funkcją aktywacji jądra sigmoidalnego jest bipolarna funkcja sigmoidalna. Równanie funkcji jądra hiperbolicznego jest następujące:

To jądro jest bardzo używane i popularne wśród maszyn wektorów wsparcia.

7. Jądro podstawy radialnej Anova - wiadomo, że jądro to bardzo dobrze radzi sobie w problemach z regresją wielowymiarową, podobnie jak jądra Gaussa i Laplaciana. Dotyczy to również kategorii jądra opartego na radialnym jądrze.

Równanie dla jądra Anova jest następujące:

Istnieje o wiele więcej rodzajów metod jądra i omówiliśmy najczęściej używane jądra. Zależy to wyłącznie od rodzaju problemu, który decyduje o użyciu funkcji jądra.

Wniosek

W tej sekcji widzieliśmy definicję jądra i sposób jego działania. Próbowaliśmy wyjaśnić za pomocą diagramów na temat działania jąder. Następnie próbowaliśmy podać prostą ilustrację z wykorzystaniem matematyki na temat funkcji jądra. W końcowej części zobaczyliśmy różne typy funkcji jądra, które są dziś powszechnie używane.

Polecane artykuły

Jest to przewodnik po metodach jądra. Tutaj omawiamy wprowadzenie, potrzebę, jego działanie i rodzaje metod jądra z odpowiednim równaniem. Możesz także przejrzeć nasze inne sugerowane artykuły, aby dowiedzieć się więcej -

  1. Algorytmy eksploracji danych
  2. K- oznacza algorytm grupowania
  3. Algorytm Brute Force
  4. Algorytm drzewa decyzyjnego
  5. Metody jądra w uczeniu maszynowym
  6. Drzewo decyzyjne w uczeniu maszynowym

Kategoria: