Różnice między uczeniem nadzorowanym a uczeniem głębokim

W uczeniu nadzorowanym dane szkoleniowe podawane do algorytmu zawierają pożądane rozwiązania, zwane etykietami. Typowym nadzorowanym zadaniem uczenia się jest klasyfikacja. Filtr spamu jest dobrym tego przykładem: jest szkolony z wieloma przykładowymi wiadomościami e-mail wraz z ich klasą (spam lub szynka) i musi nauczyć się, jak klasyfikować nowe wiadomości e-mail.

Głębokie uczenie się jest próbą naśladowania aktywności w warstwach neuronów w korze nowej, która stanowi około 80% mózgu, w którym występuje myślenie (w ludzkim mózgu jest około 100 miliardów neuronów i 100 ~ 1000 bilionów synaps). Nazywa się to głębokim, ponieważ ma więcej niż jedną ukrytą warstwę neuronów, które pomagają uzyskać wiele stanów nieliniowej transformacji cech

Bezpośrednie porównanie nadzorowanego uczenia się z głębokim uczeniem się (infografiki)

Poniżej znajduje się porównanie 5 najlepszych między nadzorowanym uczeniem się a głębokim uczeniem się

Kluczowe różnice między uczeniem nadzorowanym a uczeniem głębokim

Zarówno nauka nadzorowana, jak i nauka głęboka są popularnymi wyborami na rynku; omówmy niektóre z głównych różnic między uczeniem nadzorowanym a uczeniem głębokim:

● Główne modele -

Ważne nadzorowane modele to:

k-Najbliżsi sąsiedzi - Używany do klasyfikacji i regresji
Regresja liniowa - do prognozowania / regresji
Ression Regresja logistyczna - do klasyfikacji
Obsługa maszyn wektorowych (SVM) - służy do klasyfikacji i regresji
Trees Drzewa decyzyjne i losowe lasy - zarówno zadania klasyfikacji, jak i regresji

Najpopularniejsze głębokie sieci neuronowe:

Perceptrony wielowarstwowe (MLP) - najbardziej podstawowy typ. Sieć ta jest zasadniczo początkową fazą budowy innej, bardziej zaawansowanej sieci głębokiej i może być wykorzystywana do wszelkich nadzorowanych problemów z regresją lub klasyfikacją

Autoencodery (AE) - sieć ma algorytmy uczenia bez nadzoru do uczenia się funkcji, zmniejszania wymiarów i wykrywania wartości odstających

Convolution Neural Network (CNN) - szczególnie nadaje się do danych przestrzennych, rozpoznawania obiektów i analizy obrazów z wykorzystaniem wielowymiarowych struktur neuronów. Jednym z głównych powodów popularności ostatnio głębokiego uczenia się są CNN.

Recurrent Neural Network (RNN) - RNN są używane do sekwencjonowanej analizy danych, takich jak szeregi czasowe, analiza nastrojów, NLP, tłumaczenie języka, rozpoznawanie mowy, podpisywanie obrazów. Jednym z najczęstszych typów modeli RNN jest sieć Long Short-Term Memory (LSTM).

Dane szkoleniowe - jak wspomniano wcześniej, nadzorowane modele potrzebują danych szkoleniowych z etykietami. Głębokie uczenie się może obsługiwać dane z etykietami lub bez. Niektóre architektury sieci neuronowych mogą być bez nadzoru, takie jak autokodery i ograniczone maszyny Boltzmanna

Wybór funkcji - niektóre nadzorowane modele są w stanie analizować funkcje i wybrany podzbiór funkcji w celu ustalenia celu. Ale przez większość czasu musi to być obsługiwane na etapie przygotowania danych. Ale w Deep Neural Networks pojawiają się nowe funkcje, a niepożądane funkcje są odrzucane w miarę postępu nauki.

Reprezentacja danych - W klasycznych modelach nadzorowanych abstrakcja wysokiego poziomu funkcji wejściowych nie jest tworzona. Ostateczny model próbujący przewidzieć dane wyjściowe poprzez zastosowanie przekształceń matematycznych w podzbiorze cech wejściowych.
Ale w głębokich sieciach neuronowych abstrakcje cech wejściowych są tworzone wewnętrznie. Na przykład podczas tłumaczenia tekstu sieć neuronowa najpierw konwertuje tekst wejściowy na kodowanie wewnętrzne, a następnie przekształca tę abstrakcyjną reprezentację na język docelowy.

Framework - Modele ML nadzorowane są obsługiwane przez wiele ogólnych ram ML w różnych językach - niektóre z nich to Apache Mahout, Scikit Learn, Spark ML.
Większość platform do głębokiego uczenia zapewnia abstrakcję przyjazną dla programistów, aby łatwo utworzyć sieć, zająć się dystrybucją obliczeń i ma wsparcie dla procesorów graficznych. Popularne są frameworki: Caffe, Caffe2, Theano, Torch, Keras, CNTK, TensorFlow. teraz z aktywnym wsparciem społeczności.

Tabela nadzorowana w porównaniu do uczenia głębokiego

Poniżej znajduje się kluczowe porównanie między uczeniem nadzorowanym a uczeniem głębokim

Podstawa porównania między uczeniem nadzorowanym a uczeniem głębokim Nadzorowana nauka Głęboka nauka
Szkolenie modeloweGłówne zadania w szkoleniu -

  • Iteruj przez instancje szkoleniowe, głównie jako mini-partie, i aktualizuj wagi stosowane dla funkcji.
  • Kierunek aktualizacji masy (przyrost lub spadek) określony przez niektóre wskaźniki, takie jak gradient funkcji błędu względem masy.
  • Wreszcie cel jest formułowany jako transformacja na ważonej sumie cech podzbioru.
Główne zadania w szkoleniu -

  • Liczba wag do aktualizacji jest bardzo duża, jeśli liczba ukrytych warstw jest większa.
  • Błąd w wartości docelowej obliczanej najpierw i przenoszonej z powrotem na każdą warstwę
  • Znajdź częściową pochodną wag wrt funkcji błędu i zaktualizuj wagi, aby zmniejszyć błąd.
Potencjał systemuSłuży do rozwiązywania stosunkowo prostych zadań, w których związek z cechami wejściowymi i celem jest wykrywalny przez człowieka, a inżynieria cech jest bezpośrednia. Np .:

  • Klasyfikacja dwumianowa lub wieloklasowa, taka jak klasyfikacja klientów na podstawie ich interakcji z witryną.
  • Przewiduj wartość nieruchomości na podstawie zebranych podobnych danych.
Głębokie uczenie się może wykonywać naprawdę inteligentne zadania, takie jak

  • Klasyfikacja obrazów na poziomie zbliżonym do ludzkiego
  • Rozpoznawanie mowy na poziomie zbliżonym do ludzkiego
  • Transkrypcja pisma ręcznego na poziomie zbliżonym do ludzkiego
  • Poprawione tłumaczenie maszynowe
  • Cyfrowi asystenci, tacy jak Google Now i Amazon Alexa
ElastycznośćModele są bardziej elastyczne, co pozwala łatwo dostroić model ML. Istnieją dobrze zdefiniowane metody, takie jak wyszukiwanie siatki z walidacją krzyżową w celu znalezienia odpowiednich hiperparametrówMniej elastyczny, ponieważ istnieje wiele hiperparametrów do dostosowania, takich jak liczba warstw, liczba neuronów na warstwę, rodzaj funkcji aktywacji do użycia w każdej warstwie, logika inicjalizacji masy i wiele innych.
Reprezentacja funkcjiFunkcje pochodne lub abstrakcyjne, które należy utworzyć jawnie. Na przykład cechy wielomianowe jako dane wejściowe dla modelu regresji liniowejAbstrakcyjna reprezentacja danych generowana automatycznie w ukrytych warstwach. Dlatego wyszkolona sieć neuronowa CNN może wykryć kota na obrazie.
Modele generatywneNie można wygenerować niczego oryginalnego, ponieważ nie ma automatycznej reprezentacji danych abstrakcyjnychPo przeszkoleniu określony rodzaj głębokiej sieci neuronowej może generować powiedz nowe obrazy, piosenki lub teksty. Są to tak zwane GNN (Generative Neural Network) lub GAN (Generative Adversarial Networks)

Niektóre wdrożenia tego typu sieci są wykorzystywane do tworzenia nawet nowych projektów mody

Wniosek - uczenie nadzorowane a uczenie głębokie

Dokładność i możliwości DNN (Deep Neural Network) znacznie wzrosły w ciągu ostatnich kilku lat. Właśnie dlatego DNN są obecnie obszarem aktywnych badań i, naszym zdaniem, ma potencjał do opracowania Ogólnego Inteligentnego Systemu. Jednocześnie trudno jest zrozumieć, dlaczego DNN daje określoną moc wyjściową, co bardzo utrudnia dostrojenie sieci. Jeśli więc problem można rozwiązać za pomocą prostych modeli ML, zdecydowanie zaleca się jego użycie. Z tego powodu prosta regresja liniowa będzie miała znaczenie, nawet jeśli ogólny inteligentny system zostanie opracowany przy użyciu DNN.

Polecany artykuł

Jest to przewodnik po najważniejszych różnicach między nauczaniem nadzorowanym a uczeniem głębokim. W tym miejscu omawiamy również kluczowe różnice między uczeniem się nadzorowanym a uczeniem się głębokim za pomocą infografiki i tabeli porównawczej. Możesz także zapoznać się z następującymi artykułami -

  1. Uczenie nadzorowane a uczenie się wzmacniające
  2. Uczenie nadzorowane a uczenie się bez nadzoru
  3. Sieci neuronowe a głębokie uczenie się
  4. Uczenie maszynowe a analiza predykcyjna
  5. TensorFlow vs Caffe: jakie są różnice
  6. Co to jest nauka nadzorowana?
  7. Co to jest nauka zbrojenia?
  8. Top 6 porównań między CNN a RNN

Kategoria: