Wprowadzenie do nadzorowanego uczenia się i uczenia się bez nadzoru

Uczenie nadzorowane i uczenie się bez nadzoru to zadania uczenia maszynowego.
Uczenie nadzorowane to po prostu proces uczenia się algorytmu z zestawu danych szkoleniowych. Uczenie nadzorowane polega na tym, że masz zmienne wejściowe i zmienne wyjściowe i używasz algorytmu do uczenia się funkcji mapowania od wejścia do wyjścia. Celem jest przybliżenie funkcji mapowania, aby gdy mamy nowe dane wejściowe, mogliśmy przewidzieć zmienne wyjściowe dla tych danych.

Uczenie się bez nadzoru polega na modelowaniu podstawowej lub ukrytej struktury lub dystrybucji danych w celu uzyskania dodatkowych informacji na temat danych. Uczenie się bez nadzoru to miejsce, w którym masz tylko dane wejściowe i brak odpowiednich zmiennych wyjściowych.

Zestaw danych szkoleniowych: zestaw przykładów używanych do nauki, w których znana jest wartość docelowa.

Bezpośrednie porównania między uczeniem nadzorowanym a uczeniem się bez nadzoru (infografiki)

Poniżej znajduje się porównanie 7 najlepszych między uczeniem się nadzorowanym a uczeniem się bez nadzoru

Kluczowe różnice między nauczaniem nadzorowanym a uczeniem się bez nadzoru

Poniżej znajdują się listy punktów, opisujące kluczowe różnice między uczeniem nadzorowanym a uczeniem się bez nadzoru

1. Algorytmy uczenia maszynowego odkrywają wzorce w dużych danych. Te różne algorytmy można podzielić na dwie kategorie na podstawie sposobu, w jaki „uczą się” o danych w celu tworzenia prognoz. Są to nadzorowane i bez nadzoru uczenie się.

2. W nadzorowanym uczeniu naukowiec działa jako przewodnik, aby nauczyć algorytm, jakie wnioski lub prognozy powinien wyciągnąć. W uczeniu bez nadzoru nie ma poprawnej odpowiedzi, nie ma nauczyciela, algorytmy są pozostawione samym sobie, aby odkryć i przedstawić interesującą ukrytą strukturę danych.

3. Model uczenia nadzorowanego wykorzysta dane szkoleniowe do poznania powiązania między danymi wejściowymi i wyjściowymi.

4. Uczenie się bez nadzoru nie korzysta z danych wyjściowych. W uczeniu się bez nadzoru nie będzie to oznaczona wcześniejsza wiedza, podczas gdy w uczeniu nadzorowanym będzie miał dostęp do etykiet i będzie miał wcześniejszą wiedzę na temat zbiorów danych

5. Uczenie nadzorowane: Chodzi o to, że szkolenie można uogólnić i model można stosować z nowymi danymi z pewną dokładnością.

6. Algorytmy uczenia nadzorowanego: maszyna wektorów pomocniczych, regresja liniowa i logistyczna, sieć neuronowa, drzewa klasyfikacyjne i losowy las itp.

7. Nie nadzorowane algorytmy można podzielić na różne kategorie: algorytmy klastrowe, średnie K, hierarchiczne grupowanie, algorytmy redukcji wymiarowej, wykrywanie anomalii itp.

8. Powszechnie stosowane algorytmy klasyfikacji i regresji w uczeniu nadzorowanym. Maszyny wektorowe wspomagające (SVM) to nadzorowane modele uczenia maszynowego wraz z powiązanymi algorytmami uczenia się, które mogą być używane zarówno do celów klasyfikacji, jak i regresji, ale najczęściej stosowane do problemów z klasyfikacją.

9. W modelu SVM wykreślamy każdy element danych jako punkt w przestrzeni n-wymiarowej (gdzie n to cechy, które mamy), przy czym wartości każdej cechy są wartością konkretnej współrzędnej. Następnie dokonano klasyfikacji poprzez znalezienie hiperpłaszczyzny, która odróżnia dwie klasy.

10. Głównym celem algorytmów regresji jest przewidywanie wartości dyskretnej lub ciągłej. W niektórych przypadkach przewidywaną wartość można wykorzystać do identyfikacji liniowej zależności między atrybutami. Na podstawie algorytmów regresji różnicy problemów można zastosować. Niektóre podstawowe algorytmy regresji to regresja liniowa, regresja wielomianowa itp.

11. Klastrowanie jest szeroko stosowane w uczeniu się bez nadzoru. Klastrowanie polega na dzieleniu punktów danych na liczbę grup, tak aby punkty o tych samych cechach były razem w formie klastra. Istnieje więcej algorytmów klastrowych; kilka z nich to modele łączności, modele środka ciężkości, modele dystrybucji i modele gęstości.

12. Hierarchiczne grupowanie podlega uczeniu się bez nadzoru. Hierarchiczne grupowanie, jak sama nazwa wskazuje, jest algorytmem budującym hierarchię klastrów. Algorytm ten rozpoczyna się od wszystkich punktów danych przypisanych do własnego klastra. Następnie dwa najbliższe klastry są łączone w ten sam klaster. Ostatecznie algorytm ten kończy się, gdy pozostanie tylko jeden klaster.

13.KMeans jest objęty bezobsługową metodą grupowania. Dane zostaną podzielone na k klastrów, w zależności od ich funkcji. Każda gromada jest reprezentowana przez środek ciężkości, zdefiniowany jako środek punktów w gromadzie. KMeans jest prosty i szybki, ale nie daje tego samego wyniku przy każdym uruchomieniu.

14. Aby lepiej zrozumieć nadzorowane uczenie się i uczenie się bez nadzoru, weźmy przykłady z życia. Uczenie nadzorowane: Weźmy na przykład jedną z funkcji Gmaila, czyli spam. Na podstawie wcześniejszych informacji o wiadomościach spamowych, odfiltrowanie nowej wiadomości przychodzącej do folderu skrzynki odbiorczej lub folderu śmieci. W tym scenariuszu Gmail jest modelowany jako funkcja mapowania w celu segregacji poczty przychodzącej na podstawie wcześniejszej wiedzy o wiadomościach e-mail, jest to nauka nadzorowana.

15.Nadzorowane uczenie się: załóżmy, że przyjaciel zaprasza cię na przyjęcie, na którym poznajesz nowych ludzi. Teraz sklasyfikujesz je bez wcześniejszej wiedzy (nauka bez nadzoru) i ta klasyfikacja może dotyczyć dowolnej cechy. Może to być grupa wiekowa, płeć, ubranie, kwalifikacje edukacyjne lub jakikolwiek inny sposób. Ponieważ nie wykorzystałeś żadnej wcześniejszej wiedzy o ludziach i nie sklasyfikowałeś ich, jest to objęte nauką bez nadzoru.

Tabela porównawcza uczenia się nadzorowanego a porównanie uczenia się bez nadzoru

Nadzorowana naukaUczenie się bez nadzoru

metoda

Podane zostaną zmienne wejściowe i wyjściowe.Podane będą tylko dane wejściowe

Cel

Nadzorowany cel uczenia się polega na takim określeniu funkcji, aby po podaniu nowego zestawu danych wejściowych przewidzieć wynik.Niezamierzonym celem uczenia się jest modelowanie ukrytych wzorców lub podstawowej struktury w danych wejściowych w celu uzyskania informacji na temat danych.

Klasa

Problemy uczenia maszynowego, eksploracji danych i sieci neuronowej,Uczenie maszynowe, eksploracja danych, problemy i sieć neuronowa

Przykłady

  • Klasyfikacja
  • Regresja
  • Regresja liniowa
  • Maszyna wektorów nośnych
  • Grupowanie
  • Stowarzyszenie
  • k-oznacza
  • Stowarzyszenie
Kto używaBadacze danychBadacze danych

Ekosystemy

Przetwarzanie dużych danych, eksploracja danych itp

Przetwarzanie dużych danych, eksploracja danych itp

Używa

Nadzorowane uczenie się jest często stosowane w systemach eksportowych w rozpoznawaniu obrazu, rozpoznawaniu mowy, prognozowaniu, analizie finansowej i szkoleniu sieci neuronowych i drzew decyzyjnych itp.

Algorytmy uczenia bez nadzoru są wykorzystywane do wstępnego przetwarzania danych, podczas analizy eksploracyjnej lub do trenowania algorytmów uczenia nadzorowanego.

Wniosek - Uczenie nadzorowane a uczenie się bez nadzoru

Wybór zastosowania nadzorowanego lub nienadzorowanego algorytmu uczenia maszynowego zwykle zależy od czynników związanych ze strukturą i ilością danych oraz przypadkiem użycia. W rzeczywistości, przez większość czasu, naukowcy wykorzystują zarówno podejście do nauki nadzorowanej, jak i nauki bez nadzoru, aby rozwiązać przypadek użycia.

Polecany artykuł

Jest to przewodnik po nauczaniu nadzorowanym a uczeniu się bez nadzoru, ich znaczeniu, porównaniu bezpośrednim, kluczowych różnicach, tabeli porównawczej i wnioskach. Możesz także przejrzeć następujące artykuły, aby dowiedzieć się więcej -

  1. Najlepsze porównanie 7 między uczeniem nadzorowanym a uczeniem się wzmacniającym
  2. 5 Najbardziej użyteczna różnica między Data Science a Machine Learning
  3. Poznaj 10 najlepszych różnic między redukcją mapy a przędzą
  4. MapReduce vs Apache Spark - 20 przydatnych porównań do nauki
  5. Co to jest nauka zbrojenia?

Kategoria: